Salvato in:
| Autori principali: | Xiong, Zhen, Li, Yuqi, Yang, Chuanguang, Tan, Tiao, Zhu, Zhihong, Li, Siyuan, Ma, Yue |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2025
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2501.07070 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
Prototype-Driven Multi-Feature Generation for Visible-Infrared Person Re-identification
di: Li, Jiarui, et al.
Pubblicazione: (2024)
di: Li, Jiarui, et al.
Pubblicazione: (2024)
SRKD: Towards Efficient 3D Point Cloud Segmentation via Structure- and Relation-aware Knowledge Distillation
di: Li, Yuqi, et al.
Pubblicazione: (2025)
di: Li, Yuqi, et al.
Pubblicazione: (2025)
Towards Generalizable AI-Generated Image Detection via Image-Adaptive Prompt Learning
di: Li, Yiheng, et al.
Pubblicazione: (2025)
di: Li, Yiheng, et al.
Pubblicazione: (2025)
PPBoost: Progressive Prompt Boosting for Text-Driven Medical Image Segmentation
di: Li, Xuchen, et al.
Pubblicazione: (2025)
di: Li, Xuchen, et al.
Pubblicazione: (2025)
Agent Banana: High-Fidelity Image Editing with Agentic Thinking and Tooling
di: Ye, Ruijie, et al.
Pubblicazione: (2026)
di: Ye, Ruijie, et al.
Pubblicazione: (2026)
PromptSafe: Gated Prompt Tuning for Safe Text-to-Image Generation
di: Jing, Zonglei, et al.
Pubblicazione: (2025)
di: Jing, Zonglei, et al.
Pubblicazione: (2025)
Enhance Image-to-Image Generation with LLaVA-generated Prompts
di: Ding, Zhicheng, et al.
Pubblicazione: (2024)
di: Ding, Zhicheng, et al.
Pubblicazione: (2024)
Forge-and-Quench: Enhancing Image Generation for Higher Fidelity in Unified Multimodal Models
di: Zeng, Yanbing, et al.
Pubblicazione: (2026)
di: Zeng, Yanbing, et al.
Pubblicazione: (2026)
Relational Diffusion Distillation for Efficient Image Generation
di: Feng, Weilun, et al.
Pubblicazione: (2024)
di: Feng, Weilun, et al.
Pubblicazione: (2024)
Progressive Vision-Language Prompt for Multi-Organ Multi-Class Cell Semantic Segmentation with Single Branch
di: Zhang, Qing, et al.
Pubblicazione: (2024)
di: Zhang, Qing, et al.
Pubblicazione: (2024)
SSPA: Split-and-Synthesize Prompting with Gated Alignments for Multi-Label Image Recognition
di: Tan, Hao, et al.
Pubblicazione: (2024)
di: Tan, Hao, et al.
Pubblicazione: (2024)
PVLR: Prompt-driven Visual-Linguistic Representation Learning for Multi-Label Image Recognition
di: Tan, Hao, et al.
Pubblicazione: (2024)
di: Tan, Hao, et al.
Pubblicazione: (2024)
Parameterized Prompt for Incremental Object Detection
di: An, Zijia, et al.
Pubblicazione: (2025)
di: An, Zijia, et al.
Pubblicazione: (2025)
Progressive Translation of H&E to IHC with Enhanced Structural Fidelity
di: Kang, Yuhang, et al.
Pubblicazione: (2025)
di: Kang, Yuhang, et al.
Pubblicazione: (2025)
Enhancing Infrared Vision: Progressive Prompt Fusion Network and Benchmark
di: Liu, Jinyuan, et al.
Pubblicazione: (2025)
di: Liu, Jinyuan, et al.
Pubblicazione: (2025)
GaitKD: A Universal Decoupled Distillation Framework for Efficient Gait Recognition
di: Li, Yuqi, et al.
Pubblicazione: (2026)
di: Li, Yuqi, et al.
Pubblicazione: (2026)
Object Fidelity Diffusion for Remote Sensing Image Generation
di: Ye, Ziqi, et al.
Pubblicazione: (2025)
di: Ye, Ziqi, et al.
Pubblicazione: (2025)
S$^2$Q-VDiT: Accurate Quantized Video Diffusion Transformer with Salient Data and Sparse Token Distillation
di: Feng, Weilun, et al.
Pubblicazione: (2025)
di: Feng, Weilun, et al.
Pubblicazione: (2025)
Echo-Forcing: A Scene Memory Framework for Interactive Long Video Generation
di: Wu, Mingqiang, et al.
Pubblicazione: (2026)
di: Wu, Mingqiang, et al.
Pubblicazione: (2026)
Enhancing Vision-Language Models Generalization via Diversity-Driven Novel Feature Synthesis
di: Yan, Siyuan, et al.
Pubblicazione: (2024)
di: Yan, Siyuan, et al.
Pubblicazione: (2024)
InsightTok: Improving Text and Face Fidelity in Discrete Tokenization for Autoregressive Image Generation
di: Yue, Yang, et al.
Pubblicazione: (2026)
di: Yue, Yang, et al.
Pubblicazione: (2026)
Training-Free Generation of Diverse and High-Fidelity Images via Prompt Semantic Space Optimization
di: Meng, Debin, et al.
Pubblicazione: (2025)
di: Meng, Debin, et al.
Pubblicazione: (2025)
AMMKD: Adaptive Multimodal Multi-teacher Distillation for Lightweight Vision-Language Models
di: Li, Yuqi, et al.
Pubblicazione: (2025)
di: Li, Yuqi, et al.
Pubblicazione: (2025)
MMT-ARD: Multimodal Multi-Teacher Adversarial Distillation for Robust Vision-Language Models
di: Li, Yuqi, et al.
Pubblicazione: (2025)
di: Li, Yuqi, et al.
Pubblicazione: (2025)
AtomoVideo: High Fidelity Image-to-Video Generation
di: Gong, Litong, et al.
Pubblicazione: (2024)
di: Gong, Litong, et al.
Pubblicazione: (2024)
Progressive Prompt-Guided Cross-Modal Reasoning for Referring Image Segmentation
di: Li, Jiachen, et al.
Pubblicazione: (2026)
di: Li, Jiachen, et al.
Pubblicazione: (2026)
Optimizing Negative Prompts for Enhanced Aesthetics and Fidelity in Text-To-Image Generation
di: Ogezi, Michael, et al.
Pubblicazione: (2024)
di: Ogezi, Michael, et al.
Pubblicazione: (2024)
Reduce the Artifacts Bias for More Generalizable AI-Generated Image Detection
di: Li, Yiheng, et al.
Pubblicazione: (2026)
di: Li, Yiheng, et al.
Pubblicazione: (2026)
HiFi-Mesh: High-Fidelity Efficient 3D Mesh Generation via Compact Autoregressive Dependence
di: Li, Yanfeng, et al.
Pubblicazione: (2026)
di: Li, Yanfeng, et al.
Pubblicazione: (2026)
MultiAnimate: Pose-Guided Image Animation Made Extensible
di: Hu, Yingcheng, et al.
Pubblicazione: (2026)
di: Hu, Yingcheng, et al.
Pubblicazione: (2026)
WorldCache: Accelerating World Models for Free via Heterogeneous Token Caching
di: Feng, Weilun, et al.
Pubblicazione: (2026)
di: Feng, Weilun, et al.
Pubblicazione: (2026)
Learned Image Compression with Hierarchical Progressive Context Modeling
di: Li, Yuqi, et al.
Pubblicazione: (2025)
di: Li, Yuqi, et al.
Pubblicazione: (2025)
Multi-party Collaborative Attention Control for Image Customization
di: Yang, Han, et al.
Pubblicazione: (2025)
di: Yang, Han, et al.
Pubblicazione: (2025)
DiT360: High-Fidelity Panoramic Image Generation via Hybrid Training
di: Feng, Haoran, et al.
Pubblicazione: (2025)
di: Feng, Haoran, et al.
Pubblicazione: (2025)
Structure and Progress Aware Diffusion for Medical Image Segmentation
di: Song, Siyuan, et al.
Pubblicazione: (2026)
di: Song, Siyuan, et al.
Pubblicazione: (2026)
Tuning-Free Noise Rectification for High Fidelity Image-to-Video Generation
di: Li, Weijie, et al.
Pubblicazione: (2024)
di: Li, Weijie, et al.
Pubblicazione: (2024)
MultiBooth: Towards Generating All Your Concepts in an Image from Text
di: Zhu, Chenyang, et al.
Pubblicazione: (2024)
di: Zhu, Chenyang, et al.
Pubblicazione: (2024)
Mask-ControlNet: Higher-Quality Image Generation with An Additional Mask Prompt
di: Huang, Zhiqi, et al.
Pubblicazione: (2024)
di: Huang, Zhiqi, et al.
Pubblicazione: (2024)
High-Fidelity Medical Shape Generation via Skeletal Latent Diffusion
di: Zhang, Guoqing, et al.
Pubblicazione: (2026)
di: Zhang, Guoqing, et al.
Pubblicazione: (2026)
QuantSparse: Comprehensively Compressing Video Diffusion Transformer with Model Quantization and Attention Sparsification
di: Feng, Weilun, et al.
Pubblicazione: (2025)
di: Feng, Weilun, et al.
Pubblicazione: (2025)
Documenti analoghi
-
Prototype-Driven Multi-Feature Generation for Visible-Infrared Person Re-identification
di: Li, Jiarui, et al.
Pubblicazione: (2024) -
SRKD: Towards Efficient 3D Point Cloud Segmentation via Structure- and Relation-aware Knowledge Distillation
di: Li, Yuqi, et al.
Pubblicazione: (2025) -
Towards Generalizable AI-Generated Image Detection via Image-Adaptive Prompt Learning
di: Li, Yiheng, et al.
Pubblicazione: (2025) -
PPBoost: Progressive Prompt Boosting for Text-Driven Medical Image Segmentation
di: Li, Xuchen, et al.
Pubblicazione: (2025) -
Agent Banana: High-Fidelity Image Editing with Agentic Thinking and Tooling
di: Ye, Ruijie, et al.
Pubblicazione: (2026)