Salvato in:
| Autori principali: | Jiang, Jiaxiu, Li, Wenbo, Ren, Jingjing, Qiu, Yuping, Guo, Yong, Xu, Xiaogang, Wu, Han, Zuo, Wangmeng |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2025
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2507.12952 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
MC$^2$: Multi-concept Guidance for Customized Multi-concept Generation
di: Jiang, Jiaxiu, et al.
Pubblicazione: (2024)
di: Jiang, Jiaxiu, et al.
Pubblicazione: (2024)
HP-Edit: A Human-Preference Post-Training Framework for Image Editing
di: Li, Fan, et al.
Pubblicazione: (2026)
di: Li, Fan, et al.
Pubblicazione: (2026)
Generative Inbetweening through Frame-wise Conditions-Driven Video Generation
di: Zhu, Tianyi, et al.
Pubblicazione: (2024)
di: Zhu, Tianyi, et al.
Pubblicazione: (2024)
TextLDM: Language Modeling with Continuous Latent Diffusion
di: Jiang, Jiaxiu, et al.
Pubblicazione: (2026)
di: Jiang, Jiaxiu, et al.
Pubblicazione: (2026)
LPT++: Efficient Training on Mixture of Long-tailed Experts
di: Dong, Bowen, et al.
Pubblicazione: (2024)
di: Dong, Bowen, et al.
Pubblicazione: (2024)
Aggregating Nearest Sharp Features via Hybrid Transformers for Video Deblurring
di: Shang, Wei, et al.
Pubblicazione: (2023)
di: Shang, Wei, et al.
Pubblicazione: (2023)
Auto-FlexSwitch: Efficient Dynamic Model Merging via Learnable Task Vector Compression
di: Gao, Junqi, et al.
Pubblicazione: (2026)
di: Gao, Junqi, et al.
Pubblicazione: (2026)
LoViT: Long Video Transformer for Surgical Phase Recognition
di: Liu, Yang, et al.
Pubblicazione: (2023)
di: Liu, Yang, et al.
Pubblicazione: (2023)
SelfHVD: Self-Supervised Handheld Video Deblurring
di: Xu, Honglei, et al.
Pubblicazione: (2025)
di: Xu, Honglei, et al.
Pubblicazione: (2025)
Voyager: Long-Range and World-Consistent Video Diffusion for Explorable 3D Scene Generation
di: Huang, Tianyu, et al.
Pubblicazione: (2025)
di: Huang, Tianyu, et al.
Pubblicazione: (2025)
LoVR: A Benchmark for Long Video Retrieval in Multimodal Contexts
di: Cai, Qifeng, et al.
Pubblicazione: (2025)
di: Cai, Qifeng, et al.
Pubblicazione: (2025)
LoViF 2026 The First Challenge on Weather Removal in Videos
di: Qian, Chenghao, et al.
Pubblicazione: (2026)
di: Qian, Chenghao, et al.
Pubblicazione: (2026)
Lie Flow: Video Dynamic Fields Modeling and Predicting with Lie Algebra as Geometric Physics Principle
di: Qiao, Weidong, et al.
Pubblicazione: (2026)
di: Qiao, Weidong, et al.
Pubblicazione: (2026)
QR-LoRA: Efficient and Disentangled Fine-tuning via QR Decomposition for Customized Generation
di: Yang, Jiahui, et al.
Pubblicazione: (2025)
di: Yang, Jiahui, et al.
Pubblicazione: (2025)
Improved Generation of Adversarial Examples Against Safety-aligned LLMs
di: Li, Qizhang, et al.
Pubblicazione: (2024)
di: Li, Qizhang, et al.
Pubblicazione: (2024)
Mixture of Contexts for Long Video Generation
di: Cai, Shengqu, et al.
Pubblicazione: (2025)
di: Cai, Shengqu, et al.
Pubblicazione: (2025)
VideoElevator: Elevating Video Generation Quality with Versatile Text-to-Image Diffusion Models
di: Zhang, Yabo, et al.
Pubblicazione: (2024)
di: Zhang, Yabo, et al.
Pubblicazione: (2024)
Long Context Tuning for Video Generation
di: Guo, Yuwei, et al.
Pubblicazione: (2025)
di: Guo, Yuwei, et al.
Pubblicazione: (2025)
LoCoCo: Dropping In Convolutions for Long Context Compression
di: Cai, Ruisi, et al.
Pubblicazione: (2024)
di: Cai, Ruisi, et al.
Pubblicazione: (2024)
ScrollScape: Unlocking 32K Image Generation With Video Diffusion Priors
di: Yu, Haodong, et al.
Pubblicazione: (2026)
di: Yu, Haodong, et al.
Pubblicazione: (2026)
Seeing Beyond Views: Multi-View Driving Scene Video Generation with Holistic Attention
di: Lu, Hannan, et al.
Pubblicazione: (2024)
di: Lu, Hannan, et al.
Pubblicazione: (2024)
LongLLMLingua: Accelerating and Enhancing LLMs in Long Context Scenarios via Prompt Compression
di: Jiang, Huiqiang, et al.
Pubblicazione: (2023)
di: Jiang, Huiqiang, et al.
Pubblicazione: (2023)
VideoRAG: Retrieval-Augmented Generation with Extreme Long-Context Videos
di: Ren, Xubin, et al.
Pubblicazione: (2025)
di: Ren, Xubin, et al.
Pubblicazione: (2025)
Arbitrary-Scale Video Super-Resolution with Structural and Textural Priors
di: Shang, Wei, et al.
Pubblicazione: (2024)
di: Shang, Wei, et al.
Pubblicazione: (2024)
GLaVE-Cap: Global-Local Aligned Video Captioning with Vision Expert Integration
di: Xu, Wan, et al.
Pubblicazione: (2025)
di: Xu, Wan, et al.
Pubblicazione: (2025)
NIR-Assisted Image Denoising: A Selective Fusion Approach and A Real-World Benchmark Dataset
di: Xu, Rongjian, et al.
Pubblicazione: (2024)
di: Xu, Rongjian, et al.
Pubblicazione: (2024)
Deblur4DGS: 4D Gaussian Splatting from Blurry Monocular Video
di: Wu, Renlong, et al.
Pubblicazione: (2024)
di: Wu, Renlong, et al.
Pubblicazione: (2024)
LongLoRA: Efficient Fine-tuning of Long-Context Large Language Models
di: Chen, Yukang, et al.
Pubblicazione: (2023)
di: Chen, Yukang, et al.
Pubblicazione: (2023)
Multi-Modality Driven LoRA for Adverse Condition Depth Estimation
di: Yang, Guanglei, et al.
Pubblicazione: (2024)
di: Yang, Guanglei, et al.
Pubblicazione: (2024)
Language-Guided Graph Representation Learning for Video Summarization
di: Li, Wenrui, et al.
Pubblicazione: (2025)
di: Li, Wenrui, et al.
Pubblicazione: (2025)
ViMo: Generating Motions from Casual Videos
di: Qiu, Liangdong, et al.
Pubblicazione: (2024)
di: Qiu, Liangdong, et al.
Pubblicazione: (2024)
Entropy Polarization-Based Data Compression Without Frozen Set Construction
di: Ren, Zichang, et al.
Pubblicazione: (2025)
di: Ren, Zichang, et al.
Pubblicazione: (2025)
Thin-Plate Spline-based Interpolation for Animation Line Inbetweening
di: Zhu, Tianyi, et al.
Pubblicazione: (2024)
di: Zhu, Tianyi, et al.
Pubblicazione: (2024)
Motion-Aware Adaptive Pixel Pruning for Efficient Local Motion Deblurring
di: Shang, Wei, et al.
Pubblicazione: (2025)
di: Shang, Wei, et al.
Pubblicazione: (2025)
LoVA: Long-form Video-to-Audio Generation
di: Cheng, Xin, et al.
Pubblicazione: (2024)
di: Cheng, Xin, et al.
Pubblicazione: (2024)
Turbo2K: Towards Ultra-Efficient and High-Quality 2K Video Synthesis
di: Ren, Jingjing, et al.
Pubblicazione: (2025)
di: Ren, Jingjing, et al.
Pubblicazione: (2025)
Enhanced Generative Structure Prior for Chinese Text Image Super-resolution
di: Li, Xiaoming, et al.
Pubblicazione: (2025)
di: Li, Xiaoming, et al.
Pubblicazione: (2025)
FedSmoothLoRA: Toward Smoother and Faster Convergence in Federated Low-Rank Adaptation
di: Wang, Zehao, et al.
Pubblicazione: (2026)
di: Wang, Zehao, et al.
Pubblicazione: (2026)
S2AM3D: Scale-controllable Part Segmentation of 3D Point Clouds
di: Su, Han, et al.
Pubblicazione: (2025)
di: Su, Han, et al.
Pubblicazione: (2025)
UniRestorer: Universal Image Restoration via Adaptively Estimating Image Degradation at Proper Granularity
di: Lin, Jingbo, et al.
Pubblicazione: (2024)
di: Lin, Jingbo, et al.
Pubblicazione: (2024)
Documenti analoghi
-
MC$^2$: Multi-concept Guidance for Customized Multi-concept Generation
di: Jiang, Jiaxiu, et al.
Pubblicazione: (2024) -
HP-Edit: A Human-Preference Post-Training Framework for Image Editing
di: Li, Fan, et al.
Pubblicazione: (2026) -
Generative Inbetweening through Frame-wise Conditions-Driven Video Generation
di: Zhu, Tianyi, et al.
Pubblicazione: (2024) -
TextLDM: Language Modeling with Continuous Latent Diffusion
di: Jiang, Jiaxiu, et al.
Pubblicazione: (2026) -
LPT++: Efficient Training on Mixture of Long-tailed Experts
di: Dong, Bowen, et al.
Pubblicazione: (2024)