:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autori principali:	An, Jingkun, Zhu, Yinghao, Li, Zongjian, Zhou, Enshen, Feng, Haoran, Huang, Xijie, Chen, Bohua, Shi, Yemin, Pan, Chengwei
Natura:	Preprint
Pubblicazione:	2024
Soggetti:	Computer Vision and Pattern Recognition
Accesso online:	https://arxiv.org/abs/2403.13352
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

Medical MLLM is Vulnerable: Cross-Modality Jailbreak and Mismatched Attacks on Medical Multimodal Large Language Models
di: Huang, Xijie, et al.
Pubblicazione: (2024)

SoPo: Text-to-Motion Generation Using Semi-Online Preference Optimization
di: Tan, Xiaofeng, et al.
Pubblicazione: (2024)

Scalable Ranked Preference Optimization for Text-to-Image Generation
di: Karthik, Shyamgopal, et al.
Pubblicazione: (2024)

LightM-UNet: Mamba Assists in Lightweight UNet for Medical Image Segmentation
di: Liao, Weibin, et al.
Pubblicazione: (2024)

Rich Human Feedback for Text-to-Image Generation
di: Liang, Youwei, et al.
Pubblicazione: (2023)

WebCode2M: A Real-World Dataset for Code Generation from Webpage Designs
di: Gui, Yi, et al.
Pubblicazione: (2024)

SUDO: Enhancing Text-to-Image Diffusion Models with Self-Supervised Direct Preference Optimization
di: Peng, Liang, et al.
Pubblicazione: (2025)

SuperGS: Consistent and Detailed 3D Super-Resolution Scene Reconstruction via Gaussian Splatting
di: Xie, Shiyun, et al.
Pubblicazione: (2025)

SuperGS: Super-Resolution 3D Gaussian Splatting Enhanced by Variational Residual Features and Uncertainty-Augmented Learning
di: Xie, Shiyun, et al.
Pubblicazione: (2024)

OSPO: Object-Centric Self-Improving Preference Optimization for Text-to-Image Generation
di: Oh, Yoonjin, et al.
Pubblicazione: (2025)

Text-driven 3D Human Generation via Contrastive Preference Optimization
di: Zhou, Pengfei, et al.
Pubblicazione: (2025)

Helios: Real Real-Time Long Video Generation Model
di: Yuan, Shenghai, et al.
Pubblicazione: (2026)

Invisible Relevance Bias: Text-Image Retrieval Models Prefer AI-Generated Images
di: Xu, Shicheng, et al.
Pubblicazione: (2023)

StyGazeTalk: Learning Stylized Generation of Gaze and Head Dynamics
di: Shi, Chengwei, et al.
Pubblicazione: (2025)

Towards Open-World Referring Expression Comprehension: A Benchmark with Training-free Multi-task Consistency Checker
di: Wu, Zongjian, et al.
Pubblicazione: (2026)

TIGeR: Tool-Integrated Geometric Reasoning in Vision-Language Models for Robotics
di: Han, Yi, et al.
Pubblicazione: (2025)

Compositional Text-to-Image Generation Via Region-aware Bimodal Direct Preference Optimization
di: Liu, Zhuohan, et al.
Pubblicazione: (2026)

HARIVO: Harnessing Text-to-Image Models for Video Generation
di: Kwon, Mingi, et al.
Pubblicazione: (2024)

Preference Score Distillation: Leveraging 2D Rewards to Align Text-to-3D Generation with Human Preference
di: Leng, Jiaqi, et al.
Pubblicazione: (2026)

Premier: Personalized Preference Modulation with Learnable User Embedding in Text-to-Image Generation
di: Wang, Zihao, et al.
Pubblicazione: (2026)

Learning Multi-dimensional Human Preference for Text-to-Image Generation
di: Zhang, Sixian, et al.
Pubblicazione: (2024)

Preference Adaptive and Sequential Text-to-Image Generation
di: Nabati, Ofir, et al.
Pubblicazione: (2024)

Expressive Text-to-Image Generation with Rich Text
di: Ge, Songwei, et al.
Pubblicazione: (2023)

IGenBench: Benchmarking the Reliability of Text-to-Infographic Generation
di: Tang, Yinghao, et al.
Pubblicazione: (2026)

RoboRefer: Towards Spatial Referring with Reasoning in Vision-Language Models for Robotics
di: Zhou, Enshen, et al.
Pubblicazione: (2025)

Bringing Diversity from Diffusion Models to Semantic-Guided Face Asset Generation
di: Cai, Yunxuan, et al.
Pubblicazione: (2025)

Generalizing Alignment Paradigm of Text-to-Image Generation with Preferences through $f$-divergence Minimization
di: Sun, Haoyuan, et al.
Pubblicazione: (2024)

Training-Free Text-to-Image Compositional Food Generation via Prompt Grafting
di: Pan, Xinyue, et al.
Pubblicazione: (2026)

EmoGen: Emotional Image Content Generation with Text-to-Image Diffusion Models
di: Yang, Jingyuan, et al.
Pubblicazione: (2024)

InstructUDrag: Joint Text Instructions and Object Dragging for Interactive Image Editing
di: Yu, Haoran, et al.
Pubblicazione: (2025)

Anomaly-Preference Image Generation
di: Wang, Fuyun, et al.
Pubblicazione: (2026)

Optimizing Negative Prompts for Enhanced Aesthetics and Fidelity in Text-To-Image Generation
di: Ogezi, Michael, et al.
Pubblicazione: (2024)

Curriculum-DPO++: Direct Preference Optimization via Data and Model Curricula for Text-to-Image Generation
di: Croitoru, Florinel-Alin, et al.
Pubblicazione: (2026)

A Difference-in-Difference Approach to Detecting AI-Generated Images
di: Qi, Xinyi, et al.
Pubblicazione: (2026)

Enhancing MMDiT-Based Text-to-Image Models for Similar Subject Generation
di: Wei, Tianyi, et al.
Pubblicazione: (2024)

Enhance Multimodal Consistency and Coherence for Text-Image Plan Generation
di: Lu, Xiaoxin, et al.
Pubblicazione: (2025)

Stable-Pose: Leveraging Transformers for Pose-Guided Text-to-Image Generation
di: Wang, Jiajun, et al.
Pubblicazione: (2024)

Optimizing Prompts for Text-to-Image Generation
di: Hao, Yaru, et al.
Pubblicazione: (2022)

Dual-IPO: Dual-Iterative Preference Optimization for Text-to-Video Generation
di: Yang, Xiaomeng, et al.
Pubblicazione: (2025)

Text4Seg: Reimagining Image Segmentation as Text Generation
di: Lan, Mengcheng, et al.
Pubblicazione: (2024)