:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autori principali:	Guo, Qin, Zeng, Ailing, Yue, Dongxu, Yang, Ceyuan, Cao, Yang, Guo, Hanzhong, Shen, Fei, Liu, Wei, Liu, Xihui, Xu, Dan
Natura:	Preprint
Pubblicazione:	2025
Soggetti:	Computer Vision and Pattern Recognition
Accesso online:	https://arxiv.org/abs/2507.02713
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

UniGeo: Taming Video Diffusion for Unified Consistent Geometry Estimation
di: Sun, Yang-Tian, et al.
Pubblicazione: (2025)

X-Pose: Detecting Any Keypoints
di: Yang, Jie, et al.
Pubblicazione: (2023)

Taming Lookup Tables for Efficient Image Retouching
di: Yang, Sidi, et al.
Pubblicazione: (2024)

DreamWaltz-G: Expressive 3D Gaussian Avatars from Skeleton-Guided 2D Diffusion
di: Huang, Yukun, et al.
Pubblicazione: (2024)

VFX Creator: Animated Visual Effect Generation with Controllable Diffusion Transformer
di: Liu, Xinyu, et al.
Pubblicazione: (2025)

Scaling Laws For Diffusion Transformers
di: Liang, Zhengyang, et al.
Pubblicazione: (2024)

UniForm: A Unified Multi-Task Diffusion Transformer for Audio-Video Generation
di: Zhao, Lei, et al.
Pubblicazione: (2025)

Representation Forcing for Bottleneck-Free Unified Multimodal Models
di: Wang, Yuqing, et al.
Pubblicazione: (2026)

GeoDiffMM: Geometry-Guided Conditional Diffusion for Motion Magnification
di: Liu, Xuedeng, et al.
Pubblicazione: (2025)

Explicit Critic Guidance for Aligning Diffusion Models
di: Liang, Zhengyang, et al.
Pubblicazione: (2026)

UniAnimate: Taming Unified Video Diffusion Models for Consistent Human Image Animation
di: Wang, Xiang, et al.
Pubblicazione: (2024)

UniShare: A Unified Framework for Joint Video and Receiver Recommendation in Social Sharing
di: Wang, Caimeng, et al.
Pubblicazione: (2026)

SeedVR: Seeding Infinity in Diffusion Transformer Towards Generic Video Restoration
di: Wang, Jianyi, et al.
Pubblicazione: (2025)

UniSymNet: A Unified Symbolic Network Guided by Transformer
di: Li, Xinxin, et al.
Pubblicazione: (2025)

UniCombine: Unified Multi-Conditional Combination with Diffusion Transformer
di: Wang, Haoxuan, et al.
Pubblicazione: (2025)

UniHands: Unifying Various Wild-Collected Keypoints for Personalized Hand Reconstruction
di: Zhang, Menghe, et al.
Pubblicazione: (2024)

UniViTAR: Unified Vision Transformer with Native Resolution
di: Qiao, Limeng, et al.
Pubblicazione: (2025)

VTok: A Unified Video Tokenizer with Decoupled Spatial-Temporal Latents
di: Wang, Feng, et al.
Pubblicazione: (2026)

End-to-End Training for Autoregressive Video Diffusion via Self-Resampling
di: Guo, Yuwei, et al.
Pubblicazione: (2025)

StreamUni: Achieving Streaming Speech Translation with a Unified Large Speech-Language Model
di: Guo, Shoutao, et al.
Pubblicazione: (2025)

Unveiling the Era of Spatial Computing
di: Cao, Hanzhong
Pubblicazione: (2024)

Light Aircraft Game : Basic Implementation and training results analysis
di: Cao, Hanzhong
Pubblicazione: (2025)

UniCATS: A Unified Context-Aware Text-to-Speech Framework with Contextual VQ-Diffusion and Vocoding
di: Du, Chenpeng, et al.
Pubblicazione: (2023)

A Unified Framework for Covariate Adjustment Under Stratified Randomisation
di: Fuyi Tu, et al.
Pubblicazione: (2024)

Decomposing Subject-Driven Image Generation via Intermediate Structural Prediction
di: Guo, Hanzhong, et al.
Pubblicazione: (2026)

Uni-DocDiff: A Unified Document Restoration Model Based on Diffusion
di: Zhao, Fangmin, et al.
Pubblicazione: (2025)

Taming Generative Diffusion Prior for Universal Blind Image Restoration
di: Tu, Siwei, et al.
Pubblicazione: (2024)

K-Gen: A Multimodal Language-Conditioned Approach for Interpretable Keypoint-Guided Trajectory Generation
di: Mu, Mingxuan, et al.
Pubblicazione: (2026)

Ming-UniVision: Joint Image Understanding and Generation with a Unified Continuous Tokenizer
di: Huang, Ziyuan, et al.
Pubblicazione: (2025)

UniLayDiff: A Unified Diffusion Transformer for Content-Aware Layout Generation
di: Liu, Zeyang, et al.
Pubblicazione: (2025)

Real-time Identity Defenses against Malicious Personalization of Diffusion Models
di: Guo, Hanzhong, et al.
Pubblicazione: (2024)

Modality-Composable Diffusion Policy via Inference-Time Distribution-level Composition
di: Cao, Jiahang, et al.
Pubblicazione: (2025)

Spiking Diffusion Models
di: Cao, Jiahang, et al.
Pubblicazione: (2024)

UniT: Unified Geometry Learning with Group Autoregressive Transformer
di: Wang, Haotian, et al.
Pubblicazione: (2026)

The Dawn of Video Generation: Preliminary Explorations with SORA-like Models
di: Zeng, Ailing, et al.
Pubblicazione: (2024)

UniDiffGrasp: A Unified Framework Integrating VLM Reasoning and VLM-Guided Part Diffusion for Open-Vocabulary Constrained Grasping with Dual Arms
di: Guo, Xueyang, et al.
Pubblicazione: (2025)

Design-based theory for Lasso adjustment in randomized block experiments and rerandomized experiments
di: Zhu, Ke, et al.
Pubblicazione: (2021)

Neural Jumps for Option Pricing
di: Zheng, Duosi, et al.
Pubblicazione: (2025)

UniSync: A Unified Framework for Audio-Visual Synchronization
di: Feng, Tao, et al.
Pubblicazione: (2025)

UniMoD: Efficient Unified Multimodal Transformers with Mixture-of-Depths
di: Mao, Weijia, et al.
Pubblicazione: (2025)