:: Library Catalog

Enregistré dans:

Détails bibliographiques
Auteurs principaux:	Zhang, Bowen, Cheng, Yiji, Wang, Chunyu, Zhang, Ting, Yang, Jiaolong, Tang, Yansong, Zhao, Feng, Chen, Dong, Guo, Baining
Format:	Preprint
Publié:	2024
Sujets:	Computer Vision and Pattern Recognition
Accès en ligne:	https://arxiv.org/abs/2407.06938
Tags:	Ajouter un tag Pas de tags, Soyez le premier à ajouter un tag!

Documents similaires

GaussianCube: A Structured and Explicit Radiance Representation for 3D Generative Modeling
par: Zhang, Bowen, et autres
Publié: (2024)

Gaussian Variation Field Diffusion for High-fidelity Video-to-4D Synthesis
par: Zhang, Bowen, et autres
Publié: (2025)

VolumeDiffusion: Flexible Text-to-3D Generation with Efficient Volumetric Encoder
par: Tang, Zhicong, et autres
Publié: (2023)

VASA-3D: Lifelike Audio-Driven Gaussian Head Avatars from a Single Image
par: Xu, Sicheng, et autres
Publié: (2025)

NeuRodin: A Two-stage Framework for High-Fidelity Neural Surface Reconstruction
par: Wang, Yifan, et autres
Publié: (2024)

Rodin-Lekturen
par: Brabant, Dominik
Publié: (2017)

Meta-CoT: Enhancing Granularity and Generalization in Image Editing
par: Zhang, Shiyi, et autres
Publié: (2026)

Diffusion Models without Classifier-free Guidance
par: Tang, Zhicong, et autres
Publié: (2025)

Real-Time Generation of Streamable Talking Portrait Video with Reference-Guided Deep Compression VAEs
par: Xu, Sicheng, et autres
Publié: (2026)

Structured 3D Latents for Scalable and Versatile 3D Generation
par: Xiang, Jianfeng, et autres
Publié: (2024)

High-Fidelity 3D Facial Avatar Synthesis with Controllable Fine-Grained Expressions
par: He, Yikang, et autres
Publié: (2026)

The Thinker by Auguste Rodin
par: rigsters
Publié: (2021)

VASA-1: Lifelike Audio-Driven Talking Faces Generated in Real Time
par: Xu, Sicheng, et autres
Publié: (2024)

A Simple Baseline for Spoken Language to Sign Language Translation with 3D Avatars
par: Zuo, Ronglai, et autres
Publié: (2024)

Simplified Diffusion Schrödinger Bridge
par: Tang, Zhicong, et autres
Publié: (2024)

VideoVLA: Video Generators Can Be Generalizable Robot Manipulators
par: Shen, Yichao, et autres
Publié: (2025)

Dual Diffusion Models for Multi-modal Guided 3D Avatar Generation
par: Li, Hong, et autres
Publié: (2026)

ChatUMM: Robust Context Tracking for Conversational Interleaved Generation
par: Dai, Wenxun, et autres
Publié: (2026)

LiDAR-based HD Map Localization using Semantic Generalized ICP with Road Marking Detection
par: Gong, Yansong, et autres
Publié: (2024)

Incorporating Pre-trained Diffusion Models in Solving the Schrödinger Bridge Problem
par: Tang, Zhicong, et autres
Publié: (2025)

DiffusionAvatars: Deferred Diffusion for High-fidelity 3D Head Avatars
par: Kirschstein, Tobias, et autres
Publié: (2023)

Diffusion Models are Geometry Critics: Single Image 3D Editing Using Pre-Trained Diffusion Priors
par: Wang, Ruicheng, et autres
Publié: (2024)

ScaffoldAvatar: High-Fidelity Gaussian Avatars with Patch Expressions
par: Aneja, Shivangi, et autres
Publié: (2025)

ConsistentAvatar: Learning to Diffuse Fully Consistent Talking Head Avatar with Temporal Guidance
par: Yang, Haijie, et autres
Publié: (2024)

HRM^2Avatar: High-Fidelity Real-Time Mobile Avatars from Monocular Phone Scans
par: Shi, Chao, et autres
Publié: (2025)

How Much Do Large Language Models Know about Human Motion? A Case Study in 3D Avatar Control
par: Li, Kunhang, et autres
Publié: (2025)

Hunyuan3D 2.5: Towards High-Fidelity 3D Assets Generation with Ultimate Details
par: Lai, Zeqiang, et autres
Publié: (2025)

FabricDiffusion: High-Fidelity Texture Transfer for 3D Garments Generation from In-The-Wild Clothing Images
par: Zhang, Cheng, et autres
Publié: (2024)

High-Fidelity Medical Shape Generation via Skeletal Latent Diffusion
par: Zhang, Guoqing, et autres
Publié: (2026)

LATTICE: Democratize High-Fidelity 3D Generation at Scale
par: Lai, Zeqiang, et autres
Publié: (2025)

Directly Aligning the Full Diffusion Trajectory with Fine-Grained Human Preference
par: Shen, Xiangwei, et autres
Publié: (2025)

MobileManiBench: Simplifying Model Verification for Mobile Manipulation
par: Wang, Wenbo, et autres
Publié: (2026)

GarmentGS: Point-Cloud Guided Gaussian Splatting for High-Fidelity Non-Watertight 3D Garment Reconstruction
par: Tang, Zhihao, et autres
Publié: (2025)

Pragmatist: Multiview Conditional Diffusion Models for High-Fidelity 3D Reconstruction from Unposed Sparse Views
par: Zhang, Songchun, et autres
Publié: (2024)

HGC-Avatar: Hierarchical Gaussian Compression for Streamable Dynamic 3D Avatars
par: Tang, Haocheng, et autres
Publié: (2025)

WildSeg3D: Segment Any 3D Objects in the Wild from 2D Images
par: Guo, Yansong, et autres
Publié: (2025)

Tamaththul3D: High-Fidelity 3D Saudi Sign Language Avatars from Monocular Video
par: Alghamdi, Eyad, et autres
Publié: (2026)

T2S: High-resolution Time Series Generation with Text-to-Series Diffusion Models
par: Ge, Yunfeng, et autres
Publié: (2025)

GraphAvatar: Compact Head Avatars with GNN-Generated 3D Gaussians
par: Wei, Xiaobao, et autres
Publié: (2024)

GeoLRM: Geometry-Aware Large Reconstruction Model for High-Quality 3D Gaussian Generation
par: Zhang, Chubin, et autres
Publié: (2024)