Salvato in:
| Autori principali: | Guo, Qin, Zeng, Ailing, Yue, Dongxu, Yang, Ceyuan, Cao, Yang, Guo, Hanzhong, Shen, Fei, Liu, Wei, Liu, Xihui, Xu, Dan |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2025
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2507.02713 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
UniGeo: Taming Video Diffusion for Unified Consistent Geometry Estimation
di: Sun, Yang-Tian, et al.
Pubblicazione: (2025)
di: Sun, Yang-Tian, et al.
Pubblicazione: (2025)
X-Pose: Detecting Any Keypoints
di: Yang, Jie, et al.
Pubblicazione: (2023)
di: Yang, Jie, et al.
Pubblicazione: (2023)
Taming Lookup Tables for Efficient Image Retouching
di: Yang, Sidi, et al.
Pubblicazione: (2024)
di: Yang, Sidi, et al.
Pubblicazione: (2024)
DreamWaltz-G: Expressive 3D Gaussian Avatars from Skeleton-Guided 2D Diffusion
di: Huang, Yukun, et al.
Pubblicazione: (2024)
di: Huang, Yukun, et al.
Pubblicazione: (2024)
VFX Creator: Animated Visual Effect Generation with Controllable Diffusion Transformer
di: Liu, Xinyu, et al.
Pubblicazione: (2025)
di: Liu, Xinyu, et al.
Pubblicazione: (2025)
Scaling Laws For Diffusion Transformers
di: Liang, Zhengyang, et al.
Pubblicazione: (2024)
di: Liang, Zhengyang, et al.
Pubblicazione: (2024)
UniForm: A Unified Multi-Task Diffusion Transformer for Audio-Video Generation
di: Zhao, Lei, et al.
Pubblicazione: (2025)
di: Zhao, Lei, et al.
Pubblicazione: (2025)
Representation Forcing for Bottleneck-Free Unified Multimodal Models
di: Wang, Yuqing, et al.
Pubblicazione: (2026)
di: Wang, Yuqing, et al.
Pubblicazione: (2026)
GeoDiffMM: Geometry-Guided Conditional Diffusion for Motion Magnification
di: Liu, Xuedeng, et al.
Pubblicazione: (2025)
di: Liu, Xuedeng, et al.
Pubblicazione: (2025)
Explicit Critic Guidance for Aligning Diffusion Models
di: Liang, Zhengyang, et al.
Pubblicazione: (2026)
di: Liang, Zhengyang, et al.
Pubblicazione: (2026)
UniAnimate: Taming Unified Video Diffusion Models for Consistent Human Image Animation
di: Wang, Xiang, et al.
Pubblicazione: (2024)
di: Wang, Xiang, et al.
Pubblicazione: (2024)
UniShare: A Unified Framework for Joint Video and Receiver Recommendation in Social Sharing
di: Wang, Caimeng, et al.
Pubblicazione: (2026)
di: Wang, Caimeng, et al.
Pubblicazione: (2026)
SeedVR: Seeding Infinity in Diffusion Transformer Towards Generic Video Restoration
di: Wang, Jianyi, et al.
Pubblicazione: (2025)
di: Wang, Jianyi, et al.
Pubblicazione: (2025)
UniSymNet: A Unified Symbolic Network Guided by Transformer
di: Li, Xinxin, et al.
Pubblicazione: (2025)
di: Li, Xinxin, et al.
Pubblicazione: (2025)
UniCombine: Unified Multi-Conditional Combination with Diffusion Transformer
di: Wang, Haoxuan, et al.
Pubblicazione: (2025)
di: Wang, Haoxuan, et al.
Pubblicazione: (2025)
UniHands: Unifying Various Wild-Collected Keypoints for Personalized Hand Reconstruction
di: Zhang, Menghe, et al.
Pubblicazione: (2024)
di: Zhang, Menghe, et al.
Pubblicazione: (2024)
UniViTAR: Unified Vision Transformer with Native Resolution
di: Qiao, Limeng, et al.
Pubblicazione: (2025)
di: Qiao, Limeng, et al.
Pubblicazione: (2025)
VTok: A Unified Video Tokenizer with Decoupled Spatial-Temporal Latents
di: Wang, Feng, et al.
Pubblicazione: (2026)
di: Wang, Feng, et al.
Pubblicazione: (2026)
End-to-End Training for Autoregressive Video Diffusion via Self-Resampling
di: Guo, Yuwei, et al.
Pubblicazione: (2025)
di: Guo, Yuwei, et al.
Pubblicazione: (2025)
StreamUni: Achieving Streaming Speech Translation with a Unified Large Speech-Language Model
di: Guo, Shoutao, et al.
Pubblicazione: (2025)
di: Guo, Shoutao, et al.
Pubblicazione: (2025)
Unveiling the Era of Spatial Computing
di: Cao, Hanzhong
Pubblicazione: (2024)
di: Cao, Hanzhong
Pubblicazione: (2024)
Light Aircraft Game : Basic Implementation and training results analysis
di: Cao, Hanzhong
Pubblicazione: (2025)
di: Cao, Hanzhong
Pubblicazione: (2025)
UniCATS: A Unified Context-Aware Text-to-Speech Framework with Contextual VQ-Diffusion and Vocoding
di: Du, Chenpeng, et al.
Pubblicazione: (2023)
di: Du, Chenpeng, et al.
Pubblicazione: (2023)
A Unified Framework for Covariate Adjustment Under Stratified Randomisation
di: Fuyi Tu, et al.
Pubblicazione: (2024)
di: Fuyi Tu, et al.
Pubblicazione: (2024)
Decomposing Subject-Driven Image Generation via Intermediate Structural Prediction
di: Guo, Hanzhong, et al.
Pubblicazione: (2026)
di: Guo, Hanzhong, et al.
Pubblicazione: (2026)
Uni-DocDiff: A Unified Document Restoration Model Based on Diffusion
di: Zhao, Fangmin, et al.
Pubblicazione: (2025)
di: Zhao, Fangmin, et al.
Pubblicazione: (2025)
Taming Generative Diffusion Prior for Universal Blind Image Restoration
di: Tu, Siwei, et al.
Pubblicazione: (2024)
di: Tu, Siwei, et al.
Pubblicazione: (2024)
K-Gen: A Multimodal Language-Conditioned Approach for Interpretable Keypoint-Guided Trajectory Generation
di: Mu, Mingxuan, et al.
Pubblicazione: (2026)
di: Mu, Mingxuan, et al.
Pubblicazione: (2026)
Ming-UniVision: Joint Image Understanding and Generation with a Unified Continuous Tokenizer
di: Huang, Ziyuan, et al.
Pubblicazione: (2025)
di: Huang, Ziyuan, et al.
Pubblicazione: (2025)
UniLayDiff: A Unified Diffusion Transformer for Content-Aware Layout Generation
di: Liu, Zeyang, et al.
Pubblicazione: (2025)
di: Liu, Zeyang, et al.
Pubblicazione: (2025)
Real-time Identity Defenses against Malicious Personalization of Diffusion Models
di: Guo, Hanzhong, et al.
Pubblicazione: (2024)
di: Guo, Hanzhong, et al.
Pubblicazione: (2024)
Modality-Composable Diffusion Policy via Inference-Time Distribution-level Composition
di: Cao, Jiahang, et al.
Pubblicazione: (2025)
di: Cao, Jiahang, et al.
Pubblicazione: (2025)
Spiking Diffusion Models
di: Cao, Jiahang, et al.
Pubblicazione: (2024)
di: Cao, Jiahang, et al.
Pubblicazione: (2024)
UniT: Unified Geometry Learning with Group Autoregressive Transformer
di: Wang, Haotian, et al.
Pubblicazione: (2026)
di: Wang, Haotian, et al.
Pubblicazione: (2026)
The Dawn of Video Generation: Preliminary Explorations with SORA-like Models
di: Zeng, Ailing, et al.
Pubblicazione: (2024)
di: Zeng, Ailing, et al.
Pubblicazione: (2024)
UniDiffGrasp: A Unified Framework Integrating VLM Reasoning and VLM-Guided Part Diffusion for Open-Vocabulary Constrained Grasping with Dual Arms
di: Guo, Xueyang, et al.
Pubblicazione: (2025)
di: Guo, Xueyang, et al.
Pubblicazione: (2025)
Design-based theory for Lasso adjustment in randomized block experiments and rerandomized experiments
di: Zhu, Ke, et al.
Pubblicazione: (2021)
di: Zhu, Ke, et al.
Pubblicazione: (2021)
Neural Jumps for Option Pricing
di: Zheng, Duosi, et al.
Pubblicazione: (2025)
di: Zheng, Duosi, et al.
Pubblicazione: (2025)
UniSync: A Unified Framework for Audio-Visual Synchronization
di: Feng, Tao, et al.
Pubblicazione: (2025)
di: Feng, Tao, et al.
Pubblicazione: (2025)
UniMoD: Efficient Unified Multimodal Transformers with Mixture-of-Depths
di: Mao, Weijia, et al.
Pubblicazione: (2025)
di: Mao, Weijia, et al.
Pubblicazione: (2025)
Documenti analoghi
-
UniGeo: Taming Video Diffusion for Unified Consistent Geometry Estimation
di: Sun, Yang-Tian, et al.
Pubblicazione: (2025) -
X-Pose: Detecting Any Keypoints
di: Yang, Jie, et al.
Pubblicazione: (2023) -
Taming Lookup Tables for Efficient Image Retouching
di: Yang, Sidi, et al.
Pubblicazione: (2024) -
DreamWaltz-G: Expressive 3D Gaussian Avatars from Skeleton-Guided 2D Diffusion
di: Huang, Yukun, et al.
Pubblicazione: (2024) -
VFX Creator: Animated Visual Effect Generation with Controllable Diffusion Transformer
di: Liu, Xinyu, et al.
Pubblicazione: (2025)