Enregistré dans:
| Auteurs principaux: | Zhang, Bowen, Cheng, Yiji, Wang, Chunyu, Zhang, Ting, Yang, Jiaolong, Tang, Yansong, Zhao, Feng, Chen, Dong, Guo, Baining |
|---|---|
| Format: | Preprint |
| Publié: |
2024
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2407.06938 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
GaussianCube: A Structured and Explicit Radiance Representation for 3D Generative Modeling
par: Zhang, Bowen, et autres
Publié: (2024)
par: Zhang, Bowen, et autres
Publié: (2024)
Gaussian Variation Field Diffusion for High-fidelity Video-to-4D Synthesis
par: Zhang, Bowen, et autres
Publié: (2025)
par: Zhang, Bowen, et autres
Publié: (2025)
VolumeDiffusion: Flexible Text-to-3D Generation with Efficient Volumetric Encoder
par: Tang, Zhicong, et autres
Publié: (2023)
par: Tang, Zhicong, et autres
Publié: (2023)
VASA-3D: Lifelike Audio-Driven Gaussian Head Avatars from a Single Image
par: Xu, Sicheng, et autres
Publié: (2025)
par: Xu, Sicheng, et autres
Publié: (2025)
NeuRodin: A Two-stage Framework for High-Fidelity Neural Surface Reconstruction
par: Wang, Yifan, et autres
Publié: (2024)
par: Wang, Yifan, et autres
Publié: (2024)
Rodin-Lekturen
par: Brabant, Dominik
Publié: (2017)
par: Brabant, Dominik
Publié: (2017)
Meta-CoT: Enhancing Granularity and Generalization in Image Editing
par: Zhang, Shiyi, et autres
Publié: (2026)
par: Zhang, Shiyi, et autres
Publié: (2026)
Diffusion Models without Classifier-free Guidance
par: Tang, Zhicong, et autres
Publié: (2025)
par: Tang, Zhicong, et autres
Publié: (2025)
Real-Time Generation of Streamable Talking Portrait Video with Reference-Guided Deep Compression VAEs
par: Xu, Sicheng, et autres
Publié: (2026)
par: Xu, Sicheng, et autres
Publié: (2026)
Structured 3D Latents for Scalable and Versatile 3D Generation
par: Xiang, Jianfeng, et autres
Publié: (2024)
par: Xiang, Jianfeng, et autres
Publié: (2024)
High-Fidelity 3D Facial Avatar Synthesis with Controllable Fine-Grained Expressions
par: He, Yikang, et autres
Publié: (2026)
par: He, Yikang, et autres
Publié: (2026)
The Thinker by Auguste Rodin
par: rigsters
Publié: (2021)
par: rigsters
Publié: (2021)
VASA-1: Lifelike Audio-Driven Talking Faces Generated in Real Time
par: Xu, Sicheng, et autres
Publié: (2024)
par: Xu, Sicheng, et autres
Publié: (2024)
A Simple Baseline for Spoken Language to Sign Language Translation with 3D Avatars
par: Zuo, Ronglai, et autres
Publié: (2024)
par: Zuo, Ronglai, et autres
Publié: (2024)
Simplified Diffusion Schrödinger Bridge
par: Tang, Zhicong, et autres
Publié: (2024)
par: Tang, Zhicong, et autres
Publié: (2024)
VideoVLA: Video Generators Can Be Generalizable Robot Manipulators
par: Shen, Yichao, et autres
Publié: (2025)
par: Shen, Yichao, et autres
Publié: (2025)
Dual Diffusion Models for Multi-modal Guided 3D Avatar Generation
par: Li, Hong, et autres
Publié: (2026)
par: Li, Hong, et autres
Publié: (2026)
ChatUMM: Robust Context Tracking for Conversational Interleaved Generation
par: Dai, Wenxun, et autres
Publié: (2026)
par: Dai, Wenxun, et autres
Publié: (2026)
LiDAR-based HD Map Localization using Semantic Generalized ICP with Road Marking Detection
par: Gong, Yansong, et autres
Publié: (2024)
par: Gong, Yansong, et autres
Publié: (2024)
Incorporating Pre-trained Diffusion Models in Solving the Schrödinger Bridge Problem
par: Tang, Zhicong, et autres
Publié: (2025)
par: Tang, Zhicong, et autres
Publié: (2025)
DiffusionAvatars: Deferred Diffusion for High-fidelity 3D Head Avatars
par: Kirschstein, Tobias, et autres
Publié: (2023)
par: Kirschstein, Tobias, et autres
Publié: (2023)
Diffusion Models are Geometry Critics: Single Image 3D Editing Using Pre-Trained Diffusion Priors
par: Wang, Ruicheng, et autres
Publié: (2024)
par: Wang, Ruicheng, et autres
Publié: (2024)
ScaffoldAvatar: High-Fidelity Gaussian Avatars with Patch Expressions
par: Aneja, Shivangi, et autres
Publié: (2025)
par: Aneja, Shivangi, et autres
Publié: (2025)
ConsistentAvatar: Learning to Diffuse Fully Consistent Talking Head Avatar with Temporal Guidance
par: Yang, Haijie, et autres
Publié: (2024)
par: Yang, Haijie, et autres
Publié: (2024)
HRM^2Avatar: High-Fidelity Real-Time Mobile Avatars from Monocular Phone Scans
par: Shi, Chao, et autres
Publié: (2025)
par: Shi, Chao, et autres
Publié: (2025)
How Much Do Large Language Models Know about Human Motion? A Case Study in 3D Avatar Control
par: Li, Kunhang, et autres
Publié: (2025)
par: Li, Kunhang, et autres
Publié: (2025)
Hunyuan3D 2.5: Towards High-Fidelity 3D Assets Generation with Ultimate Details
par: Lai, Zeqiang, et autres
Publié: (2025)
par: Lai, Zeqiang, et autres
Publié: (2025)
FabricDiffusion: High-Fidelity Texture Transfer for 3D Garments Generation from In-The-Wild Clothing Images
par: Zhang, Cheng, et autres
Publié: (2024)
par: Zhang, Cheng, et autres
Publié: (2024)
High-Fidelity Medical Shape Generation via Skeletal Latent Diffusion
par: Zhang, Guoqing, et autres
Publié: (2026)
par: Zhang, Guoqing, et autres
Publié: (2026)
LATTICE: Democratize High-Fidelity 3D Generation at Scale
par: Lai, Zeqiang, et autres
Publié: (2025)
par: Lai, Zeqiang, et autres
Publié: (2025)
Directly Aligning the Full Diffusion Trajectory with Fine-Grained Human Preference
par: Shen, Xiangwei, et autres
Publié: (2025)
par: Shen, Xiangwei, et autres
Publié: (2025)
MobileManiBench: Simplifying Model Verification for Mobile Manipulation
par: Wang, Wenbo, et autres
Publié: (2026)
par: Wang, Wenbo, et autres
Publié: (2026)
GarmentGS: Point-Cloud Guided Gaussian Splatting for High-Fidelity Non-Watertight 3D Garment Reconstruction
par: Tang, Zhihao, et autres
Publié: (2025)
par: Tang, Zhihao, et autres
Publié: (2025)
Pragmatist: Multiview Conditional Diffusion Models for High-Fidelity 3D Reconstruction from Unposed Sparse Views
par: Zhang, Songchun, et autres
Publié: (2024)
par: Zhang, Songchun, et autres
Publié: (2024)
HGC-Avatar: Hierarchical Gaussian Compression for Streamable Dynamic 3D Avatars
par: Tang, Haocheng, et autres
Publié: (2025)
par: Tang, Haocheng, et autres
Publié: (2025)
WildSeg3D: Segment Any 3D Objects in the Wild from 2D Images
par: Guo, Yansong, et autres
Publié: (2025)
par: Guo, Yansong, et autres
Publié: (2025)
Tamaththul3D: High-Fidelity 3D Saudi Sign Language Avatars from Monocular Video
par: Alghamdi, Eyad, et autres
Publié: (2026)
par: Alghamdi, Eyad, et autres
Publié: (2026)
T2S: High-resolution Time Series Generation with Text-to-Series Diffusion Models
par: Ge, Yunfeng, et autres
Publié: (2025)
par: Ge, Yunfeng, et autres
Publié: (2025)
GraphAvatar: Compact Head Avatars with GNN-Generated 3D Gaussians
par: Wei, Xiaobao, et autres
Publié: (2024)
par: Wei, Xiaobao, et autres
Publié: (2024)
GeoLRM: Geometry-Aware Large Reconstruction Model for High-Quality 3D Gaussian Generation
par: Zhang, Chubin, et autres
Publié: (2024)
par: Zhang, Chubin, et autres
Publié: (2024)
Documents similaires
-
GaussianCube: A Structured and Explicit Radiance Representation for 3D Generative Modeling
par: Zhang, Bowen, et autres
Publié: (2024) -
Gaussian Variation Field Diffusion for High-fidelity Video-to-4D Synthesis
par: Zhang, Bowen, et autres
Publié: (2025) -
VolumeDiffusion: Flexible Text-to-3D Generation with Efficient Volumetric Encoder
par: Tang, Zhicong, et autres
Publié: (2023) -
VASA-3D: Lifelike Audio-Driven Gaussian Head Avatars from a Single Image
par: Xu, Sicheng, et autres
Publié: (2025) -
NeuRodin: A Two-stage Framework for High-Fidelity Neural Surface Reconstruction
par: Wang, Yifan, et autres
Publié: (2024)