Salvato in:
| Autori principali: | Saggar, Arpita, Darling, Jonathan C., Sarikaya, Duygu, Hogg, David C. |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2026
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2603.07604 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
Score Before You Speak: Improving Persona Consistency in Dialogue Generation using Response Quality Scores
di: Saggar, Arpita, et al.
Pubblicazione: (2025)
di: Saggar, Arpita, et al.
Pubblicazione: (2025)
GaussianHeadTalk: Wobble-Free 3D Talking Heads with Audio Driven Gaussian Splatting
di: Agarwal, Madhav, et al.
Pubblicazione: (2025)
di: Agarwal, Madhav, et al.
Pubblicazione: (2025)
EmoTalkingGaussian: Continuous Emotion-conditioned Talking Head Synthesis
di: Cha, Junuk, et al.
Pubblicazione: (2025)
di: Cha, Junuk, et al.
Pubblicazione: (2025)
TalkingGaussian: Structure-Persistent 3D Talking Head Synthesis via Gaussian Splatting
di: Li, Jiahe, et al.
Pubblicazione: (2024)
di: Li, Jiahe, et al.
Pubblicazione: (2024)
SyncTalk: The Devil is in the Synchronization for Talking Head Synthesis
di: Peng, Ziqiao, et al.
Pubblicazione: (2023)
di: Peng, Ziqiao, et al.
Pubblicazione: (2023)
FreeTalk: Emotional Topology-Free 3D Talking Heads
di: Nocentini, Federico, et al.
Pubblicazione: (2026)
di: Nocentini, Federico, et al.
Pubblicazione: (2026)
SyncTalk++: High-Fidelity and Efficient Synchronized Talking Heads Synthesis Using Gaussian Splatting
di: Peng, Ziqiao, et al.
Pubblicazione: (2025)
di: Peng, Ziqiao, et al.
Pubblicazione: (2025)
TalkVid: A Large-Scale Diversified Dataset for Audio-Driven Talking Head Synthesis
di: Chen, Shunian, et al.
Pubblicazione: (2025)
di: Chen, Shunian, et al.
Pubblicazione: (2025)
Exploiting Temporal Audio-Visual Correlation Embedding for Audio-Driven One-Shot Talking Head Animation
di: Xu, Zhihua, et al.
Pubblicazione: (2025)
di: Xu, Zhihua, et al.
Pubblicazione: (2025)
EmoTalk3D: High-Fidelity Free-View Synthesis of Emotional 3D Talking Head
di: He, Qianyun, et al.
Pubblicazione: (2024)
di: He, Qianyun, et al.
Pubblicazione: (2024)
Monocular and Generalizable Gaussian Talking Head Animation
di: Gong, Shengjie, et al.
Pubblicazione: (2025)
di: Gong, Shengjie, et al.
Pubblicazione: (2025)
DEGSTalk: Decomposed Per-Embedding Gaussian Fields for Hair-Preserving Talking Face Synthesis
di: Deng, Kaijun, et al.
Pubblicazione: (2024)
di: Deng, Kaijun, et al.
Pubblicazione: (2024)
EmoDiffTalk:Emotion-aware Diffusion for Editable 3D Gaussian Talking Head
di: Liu, Chang, et al.
Pubblicazione: (2025)
di: Liu, Chang, et al.
Pubblicazione: (2025)
Splat-Portrait: Generalizing Talking Heads with Gaussian Splatting
di: Shi, Tong, et al.
Pubblicazione: (2026)
di: Shi, Tong, et al.
Pubblicazione: (2026)
GaussianTalker: Real-Time High-Fidelity Talking Head Synthesis with Audio-Driven 3D Gaussian Splatting
di: Cho, Kyusun, et al.
Pubblicazione: (2024)
di: Cho, Kyusun, et al.
Pubblicazione: (2024)
EDTalk: Efficient Disentanglement for Emotional Talking Head Synthesis
di: Tan, Shuai, et al.
Pubblicazione: (2024)
di: Tan, Shuai, et al.
Pubblicazione: (2024)
EDTalk++: Full Disentanglement for Controllable Talking Head Synthesis
di: Tan, Shuai, et al.
Pubblicazione: (2025)
di: Tan, Shuai, et al.
Pubblicazione: (2025)
GaussianTalker: Speaker-specific Talking Head Synthesis via 3D Gaussian Splatting
di: Yu, Hongyun, et al.
Pubblicazione: (2024)
di: Yu, Hongyun, et al.
Pubblicazione: (2024)
GSTalker: Real-time Audio-Driven Talking Face Generation via Deformable Gaussian Splatting
di: Chen, Bo, et al.
Pubblicazione: (2024)
di: Chen, Bo, et al.
Pubblicazione: (2024)
Audio-Driven Talking Face Generation with Blink Embedding and Hash Grid Landmarks Encoding
di: Zhang, Yuhui, et al.
Pubblicazione: (2026)
di: Zhang, Yuhui, et al.
Pubblicazione: (2026)
ScanTalk: 3D Talking Heads from Unregistered Scans
di: Nocentini, Federico, et al.
Pubblicazione: (2024)
di: Nocentini, Federico, et al.
Pubblicazione: (2024)
JambaTalk: Speech-Driven 3D Talking Head Generation Based on Hybrid Transformer-Mamba Model
di: Jafari, Farzaneh, et al.
Pubblicazione: (2024)
di: Jafari, Farzaneh, et al.
Pubblicazione: (2024)
Learning Dynamic Tetrahedra for High-Quality Talking Head Synthesis
di: Zhang, Zicheng, et al.
Pubblicazione: (2024)
di: Zhang, Zicheng, et al.
Pubblicazione: (2024)
TalkingHeadBench: A Multi-Modal Benchmark & Analysis of Talking-Head DeepFake Detection
di: Xiong, Xinqi, et al.
Pubblicazione: (2025)
di: Xiong, Xinqi, et al.
Pubblicazione: (2025)
StyleTalk++: A Unified Framework for Controlling the Speaking Styles of Talking Heads
di: Wang, Suzhen, et al.
Pubblicazione: (2024)
di: Wang, Suzhen, et al.
Pubblicazione: (2024)
TalkCLIP: Talking Head Generation with Text-Guided Expressive Speaking Styles
di: Ma, Yifeng, et al.
Pubblicazione: (2023)
di: Ma, Yifeng, et al.
Pubblicazione: (2023)
OT-Talk: Animating 3D Talking Head with Optimal Transportation
di: Wang, Xinmu, et al.
Pubblicazione: (2025)
di: Wang, Xinmu, et al.
Pubblicazione: (2025)
Jump Cut Smoothing for Talking Heads
di: Wang, Xiaojuan, et al.
Pubblicazione: (2024)
di: Wang, Xiaojuan, et al.
Pubblicazione: (2024)
EmoTaG: Emotion-Aware Talking Head Synthesis on Gaussian Splatting with Few-Shot Personalization
di: Xu, Haolan, et al.
Pubblicazione: (2026)
di: Xu, Haolan, et al.
Pubblicazione: (2026)
D^3-Talker: Dual-Branch Decoupled Deformation Fields for Few-Shot 3D Talking Head Synthesis
di: Guo, Yuhang, et al.
Pubblicazione: (2025)
di: Guo, Yuhang, et al.
Pubblicazione: (2025)
EmoVOCA: Speech-Driven Emotional 3D Talking Heads
di: Nocentini, Federico, et al.
Pubblicazione: (2024)
di: Nocentini, Federico, et al.
Pubblicazione: (2024)
DreamTalk: When Emotional Talking Head Generation Meets Diffusion Probabilistic Models
di: Ma, Yifeng, et al.
Pubblicazione: (2023)
di: Ma, Yifeng, et al.
Pubblicazione: (2023)
GGTalker: Talking Head Systhesis with Generalizable Gaussian Priors and Identity-Specific Adaptation
di: Hu, Wentao, et al.
Pubblicazione: (2025)
di: Hu, Wentao, et al.
Pubblicazione: (2025)
MoCoTalk: Multi-Conditional Diffusion with Adaptive Router for Controllable Talking Head Generation
di: Ye, Xinyan, et al.
Pubblicazione: (2026)
di: Ye, Xinyan, et al.
Pubblicazione: (2026)
FixTalk: Taming Identity Leakage for High-Quality Talking Head Generation in Extreme Cases
di: Tan, Shuai, et al.
Pubblicazione: (2025)
di: Tan, Shuai, et al.
Pubblicazione: (2025)
ConsistTalk: Intensity Controllable Temporally Consistent Talking Head Generation with Diffusion Noise Search
di: Liu, Zhenjie, et al.
Pubblicazione: (2025)
di: Liu, Zhenjie, et al.
Pubblicazione: (2025)
LokiTalk: Learning Fine-Grained and Generalizable Correspondences to Enhance NeRF-based Talking Head Synthesis
di: Li, Tianqi, et al.
Pubblicazione: (2024)
di: Li, Tianqi, et al.
Pubblicazione: (2024)
The Power of Certainty: How Confident Models Lead to Better Segmentation
di: Erol, Tugberk, et al.
Pubblicazione: (2025)
di: Erol, Tugberk, et al.
Pubblicazione: (2025)
NeeCo: Image Synthesis of Novel Instrument States Based on Dynamic and Deformable 3D Gaussian Reconstruction
di: Zeng, Tianle, et al.
Pubblicazione: (2025)
di: Zeng, Tianle, et al.
Pubblicazione: (2025)
Supervising 3D Talking Head Avatars with Analysis-by-Audio-Synthesis
di: Daněček, Radek, et al.
Pubblicazione: (2025)
di: Daněček, Radek, et al.
Pubblicazione: (2025)
Documenti analoghi
-
Score Before You Speak: Improving Persona Consistency in Dialogue Generation using Response Quality Scores
di: Saggar, Arpita, et al.
Pubblicazione: (2025) -
GaussianHeadTalk: Wobble-Free 3D Talking Heads with Audio Driven Gaussian Splatting
di: Agarwal, Madhav, et al.
Pubblicazione: (2025) -
EmoTalkingGaussian: Continuous Emotion-conditioned Talking Head Synthesis
di: Cha, Junuk, et al.
Pubblicazione: (2025) -
TalkingGaussian: Structure-Persistent 3D Talking Head Synthesis via Gaussian Splatting
di: Li, Jiahe, et al.
Pubblicazione: (2024) -
SyncTalk: The Devil is in the Synchronization for Talking Head Synthesis
di: Peng, Ziqiao, et al.
Pubblicazione: (2023)