:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autori principali:	Xiong, Zhen, Li, Yuqi, Yang, Chuanguang, Tan, Tiao, Zhu, Zhihong, Li, Siyuan, Ma, Yue
Natura:	Preprint
Pubblicazione:	2025
Soggetti:	Computer Vision and Pattern Recognition
Accesso online:	https://arxiv.org/abs/2501.07070
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

Prototype-Driven Multi-Feature Generation for Visible-Infrared Person Re-identification
di: Li, Jiarui, et al.
Pubblicazione: (2024)

SRKD: Towards Efficient 3D Point Cloud Segmentation via Structure- and Relation-aware Knowledge Distillation
di: Li, Yuqi, et al.
Pubblicazione: (2025)

Towards Generalizable AI-Generated Image Detection via Image-Adaptive Prompt Learning
di: Li, Yiheng, et al.
Pubblicazione: (2025)

PPBoost: Progressive Prompt Boosting for Text-Driven Medical Image Segmentation
di: Li, Xuchen, et al.
Pubblicazione: (2025)

Agent Banana: High-Fidelity Image Editing with Agentic Thinking and Tooling
di: Ye, Ruijie, et al.
Pubblicazione: (2026)

PromptSafe: Gated Prompt Tuning for Safe Text-to-Image Generation
di: Jing, Zonglei, et al.
Pubblicazione: (2025)

Enhance Image-to-Image Generation with LLaVA-generated Prompts
di: Ding, Zhicheng, et al.
Pubblicazione: (2024)

Forge-and-Quench: Enhancing Image Generation for Higher Fidelity in Unified Multimodal Models
di: Zeng, Yanbing, et al.
Pubblicazione: (2026)

Relational Diffusion Distillation for Efficient Image Generation
di: Feng, Weilun, et al.
Pubblicazione: (2024)

Progressive Vision-Language Prompt for Multi-Organ Multi-Class Cell Semantic Segmentation with Single Branch
di: Zhang, Qing, et al.
Pubblicazione: (2024)

SSPA: Split-and-Synthesize Prompting with Gated Alignments for Multi-Label Image Recognition
di: Tan, Hao, et al.
Pubblicazione: (2024)

PVLR: Prompt-driven Visual-Linguistic Representation Learning for Multi-Label Image Recognition
di: Tan, Hao, et al.
Pubblicazione: (2024)

Parameterized Prompt for Incremental Object Detection
di: An, Zijia, et al.
Pubblicazione: (2025)

Progressive Translation of H&E to IHC with Enhanced Structural Fidelity
di: Kang, Yuhang, et al.
Pubblicazione: (2025)

Enhancing Infrared Vision: Progressive Prompt Fusion Network and Benchmark
di: Liu, Jinyuan, et al.
Pubblicazione: (2025)

GaitKD: A Universal Decoupled Distillation Framework for Efficient Gait Recognition
di: Li, Yuqi, et al.
Pubblicazione: (2026)

Object Fidelity Diffusion for Remote Sensing Image Generation
di: Ye, Ziqi, et al.
Pubblicazione: (2025)

S$^2$Q-VDiT: Accurate Quantized Video Diffusion Transformer with Salient Data and Sparse Token Distillation
di: Feng, Weilun, et al.
Pubblicazione: (2025)

Echo-Forcing: A Scene Memory Framework for Interactive Long Video Generation
di: Wu, Mingqiang, et al.
Pubblicazione: (2026)

Enhancing Vision-Language Models Generalization via Diversity-Driven Novel Feature Synthesis
di: Yan, Siyuan, et al.
Pubblicazione: (2024)

InsightTok: Improving Text and Face Fidelity in Discrete Tokenization for Autoregressive Image Generation
di: Yue, Yang, et al.
Pubblicazione: (2026)

Training-Free Generation of Diverse and High-Fidelity Images via Prompt Semantic Space Optimization
di: Meng, Debin, et al.
Pubblicazione: (2025)

AMMKD: Adaptive Multimodal Multi-teacher Distillation for Lightweight Vision-Language Models
di: Li, Yuqi, et al.
Pubblicazione: (2025)

MMT-ARD: Multimodal Multi-Teacher Adversarial Distillation for Robust Vision-Language Models
di: Li, Yuqi, et al.
Pubblicazione: (2025)

AtomoVideo: High Fidelity Image-to-Video Generation
di: Gong, Litong, et al.
Pubblicazione: (2024)

Progressive Prompt-Guided Cross-Modal Reasoning for Referring Image Segmentation
di: Li, Jiachen, et al.
Pubblicazione: (2026)

Optimizing Negative Prompts for Enhanced Aesthetics and Fidelity in Text-To-Image Generation
di: Ogezi, Michael, et al.
Pubblicazione: (2024)

Reduce the Artifacts Bias for More Generalizable AI-Generated Image Detection
di: Li, Yiheng, et al.
Pubblicazione: (2026)

HiFi-Mesh: High-Fidelity Efficient 3D Mesh Generation via Compact Autoregressive Dependence
di: Li, Yanfeng, et al.
Pubblicazione: (2026)

MultiAnimate: Pose-Guided Image Animation Made Extensible
di: Hu, Yingcheng, et al.
Pubblicazione: (2026)

WorldCache: Accelerating World Models for Free via Heterogeneous Token Caching
di: Feng, Weilun, et al.
Pubblicazione: (2026)

Learned Image Compression with Hierarchical Progressive Context Modeling
di: Li, Yuqi, et al.
Pubblicazione: (2025)

Multi-party Collaborative Attention Control for Image Customization
di: Yang, Han, et al.
Pubblicazione: (2025)

DiT360: High-Fidelity Panoramic Image Generation via Hybrid Training
di: Feng, Haoran, et al.
Pubblicazione: (2025)

Structure and Progress Aware Diffusion for Medical Image Segmentation
di: Song, Siyuan, et al.
Pubblicazione: (2026)

Tuning-Free Noise Rectification for High Fidelity Image-to-Video Generation
di: Li, Weijie, et al.
Pubblicazione: (2024)

MultiBooth: Towards Generating All Your Concepts in an Image from Text
di: Zhu, Chenyang, et al.
Pubblicazione: (2024)

Mask-ControlNet: Higher-Quality Image Generation with An Additional Mask Prompt
di: Huang, Zhiqi, et al.
Pubblicazione: (2024)

High-Fidelity Medical Shape Generation via Skeletal Latent Diffusion
di: Zhang, Guoqing, et al.
Pubblicazione: (2026)

QuantSparse: Comprehensively Compressing Video Diffusion Transformer with Model Quantization and Attention Sparsification
di: Feng, Weilun, et al.
Pubblicazione: (2025)