Salvato in:
| Autori principali: | An, Jingkun, Zhu, Yinghao, Li, Zongjian, Zhou, Enshen, Feng, Haoran, Huang, Xijie, Chen, Bohua, Shi, Yemin, Pan, Chengwei |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2024
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2403.13352 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
Medical MLLM is Vulnerable: Cross-Modality Jailbreak and Mismatched Attacks on Medical Multimodal Large Language Models
di: Huang, Xijie, et al.
Pubblicazione: (2024)
di: Huang, Xijie, et al.
Pubblicazione: (2024)
SoPo: Text-to-Motion Generation Using Semi-Online Preference Optimization
di: Tan, Xiaofeng, et al.
Pubblicazione: (2024)
di: Tan, Xiaofeng, et al.
Pubblicazione: (2024)
Scalable Ranked Preference Optimization for Text-to-Image Generation
di: Karthik, Shyamgopal, et al.
Pubblicazione: (2024)
di: Karthik, Shyamgopal, et al.
Pubblicazione: (2024)
LightM-UNet: Mamba Assists in Lightweight UNet for Medical Image Segmentation
di: Liao, Weibin, et al.
Pubblicazione: (2024)
di: Liao, Weibin, et al.
Pubblicazione: (2024)
Rich Human Feedback for Text-to-Image Generation
di: Liang, Youwei, et al.
Pubblicazione: (2023)
di: Liang, Youwei, et al.
Pubblicazione: (2023)
WebCode2M: A Real-World Dataset for Code Generation from Webpage Designs
di: Gui, Yi, et al.
Pubblicazione: (2024)
di: Gui, Yi, et al.
Pubblicazione: (2024)
SUDO: Enhancing Text-to-Image Diffusion Models with Self-Supervised Direct Preference Optimization
di: Peng, Liang, et al.
Pubblicazione: (2025)
di: Peng, Liang, et al.
Pubblicazione: (2025)
SuperGS: Consistent and Detailed 3D Super-Resolution Scene Reconstruction via Gaussian Splatting
di: Xie, Shiyun, et al.
Pubblicazione: (2025)
di: Xie, Shiyun, et al.
Pubblicazione: (2025)
SuperGS: Super-Resolution 3D Gaussian Splatting Enhanced by Variational Residual Features and Uncertainty-Augmented Learning
di: Xie, Shiyun, et al.
Pubblicazione: (2024)
di: Xie, Shiyun, et al.
Pubblicazione: (2024)
OSPO: Object-Centric Self-Improving Preference Optimization for Text-to-Image Generation
di: Oh, Yoonjin, et al.
Pubblicazione: (2025)
di: Oh, Yoonjin, et al.
Pubblicazione: (2025)
Text-driven 3D Human Generation via Contrastive Preference Optimization
di: Zhou, Pengfei, et al.
Pubblicazione: (2025)
di: Zhou, Pengfei, et al.
Pubblicazione: (2025)
Helios: Real Real-Time Long Video Generation Model
di: Yuan, Shenghai, et al.
Pubblicazione: (2026)
di: Yuan, Shenghai, et al.
Pubblicazione: (2026)
Invisible Relevance Bias: Text-Image Retrieval Models Prefer AI-Generated Images
di: Xu, Shicheng, et al.
Pubblicazione: (2023)
di: Xu, Shicheng, et al.
Pubblicazione: (2023)
StyGazeTalk: Learning Stylized Generation of Gaze and Head Dynamics
di: Shi, Chengwei, et al.
Pubblicazione: (2025)
di: Shi, Chengwei, et al.
Pubblicazione: (2025)
Towards Open-World Referring Expression Comprehension: A Benchmark with Training-free Multi-task Consistency Checker
di: Wu, Zongjian, et al.
Pubblicazione: (2026)
di: Wu, Zongjian, et al.
Pubblicazione: (2026)
TIGeR: Tool-Integrated Geometric Reasoning in Vision-Language Models for Robotics
di: Han, Yi, et al.
Pubblicazione: (2025)
di: Han, Yi, et al.
Pubblicazione: (2025)
Compositional Text-to-Image Generation Via Region-aware Bimodal Direct Preference Optimization
di: Liu, Zhuohan, et al.
Pubblicazione: (2026)
di: Liu, Zhuohan, et al.
Pubblicazione: (2026)
HARIVO: Harnessing Text-to-Image Models for Video Generation
di: Kwon, Mingi, et al.
Pubblicazione: (2024)
di: Kwon, Mingi, et al.
Pubblicazione: (2024)
Preference Score Distillation: Leveraging 2D Rewards to Align Text-to-3D Generation with Human Preference
di: Leng, Jiaqi, et al.
Pubblicazione: (2026)
di: Leng, Jiaqi, et al.
Pubblicazione: (2026)
Premier: Personalized Preference Modulation with Learnable User Embedding in Text-to-Image Generation
di: Wang, Zihao, et al.
Pubblicazione: (2026)
di: Wang, Zihao, et al.
Pubblicazione: (2026)
Learning Multi-dimensional Human Preference for Text-to-Image Generation
di: Zhang, Sixian, et al.
Pubblicazione: (2024)
di: Zhang, Sixian, et al.
Pubblicazione: (2024)
Preference Adaptive and Sequential Text-to-Image Generation
di: Nabati, Ofir, et al.
Pubblicazione: (2024)
di: Nabati, Ofir, et al.
Pubblicazione: (2024)
Expressive Text-to-Image Generation with Rich Text
di: Ge, Songwei, et al.
Pubblicazione: (2023)
di: Ge, Songwei, et al.
Pubblicazione: (2023)
IGenBench: Benchmarking the Reliability of Text-to-Infographic Generation
di: Tang, Yinghao, et al.
Pubblicazione: (2026)
di: Tang, Yinghao, et al.
Pubblicazione: (2026)
RoboRefer: Towards Spatial Referring with Reasoning in Vision-Language Models for Robotics
di: Zhou, Enshen, et al.
Pubblicazione: (2025)
di: Zhou, Enshen, et al.
Pubblicazione: (2025)
Bringing Diversity from Diffusion Models to Semantic-Guided Face Asset Generation
di: Cai, Yunxuan, et al.
Pubblicazione: (2025)
di: Cai, Yunxuan, et al.
Pubblicazione: (2025)
Generalizing Alignment Paradigm of Text-to-Image Generation with Preferences through $f$-divergence Minimization
di: Sun, Haoyuan, et al.
Pubblicazione: (2024)
di: Sun, Haoyuan, et al.
Pubblicazione: (2024)
Training-Free Text-to-Image Compositional Food Generation via Prompt Grafting
di: Pan, Xinyue, et al.
Pubblicazione: (2026)
di: Pan, Xinyue, et al.
Pubblicazione: (2026)
EmoGen: Emotional Image Content Generation with Text-to-Image Diffusion Models
di: Yang, Jingyuan, et al.
Pubblicazione: (2024)
di: Yang, Jingyuan, et al.
Pubblicazione: (2024)
InstructUDrag: Joint Text Instructions and Object Dragging for Interactive Image Editing
di: Yu, Haoran, et al.
Pubblicazione: (2025)
di: Yu, Haoran, et al.
Pubblicazione: (2025)
Anomaly-Preference Image Generation
di: Wang, Fuyun, et al.
Pubblicazione: (2026)
di: Wang, Fuyun, et al.
Pubblicazione: (2026)
Optimizing Negative Prompts for Enhanced Aesthetics and Fidelity in Text-To-Image Generation
di: Ogezi, Michael, et al.
Pubblicazione: (2024)
di: Ogezi, Michael, et al.
Pubblicazione: (2024)
Curriculum-DPO++: Direct Preference Optimization via Data and Model Curricula for Text-to-Image Generation
di: Croitoru, Florinel-Alin, et al.
Pubblicazione: (2026)
di: Croitoru, Florinel-Alin, et al.
Pubblicazione: (2026)
A Difference-in-Difference Approach to Detecting AI-Generated Images
di: Qi, Xinyi, et al.
Pubblicazione: (2026)
di: Qi, Xinyi, et al.
Pubblicazione: (2026)
Enhancing MMDiT-Based Text-to-Image Models for Similar Subject Generation
di: Wei, Tianyi, et al.
Pubblicazione: (2024)
di: Wei, Tianyi, et al.
Pubblicazione: (2024)
Enhance Multimodal Consistency and Coherence for Text-Image Plan Generation
di: Lu, Xiaoxin, et al.
Pubblicazione: (2025)
di: Lu, Xiaoxin, et al.
Pubblicazione: (2025)
Stable-Pose: Leveraging Transformers for Pose-Guided Text-to-Image Generation
di: Wang, Jiajun, et al.
Pubblicazione: (2024)
di: Wang, Jiajun, et al.
Pubblicazione: (2024)
Optimizing Prompts for Text-to-Image Generation
di: Hao, Yaru, et al.
Pubblicazione: (2022)
di: Hao, Yaru, et al.
Pubblicazione: (2022)
Dual-IPO: Dual-Iterative Preference Optimization for Text-to-Video Generation
di: Yang, Xiaomeng, et al.
Pubblicazione: (2025)
di: Yang, Xiaomeng, et al.
Pubblicazione: (2025)
Text4Seg: Reimagining Image Segmentation as Text Generation
di: Lan, Mengcheng, et al.
Pubblicazione: (2024)
di: Lan, Mengcheng, et al.
Pubblicazione: (2024)
Documenti analoghi
-
Medical MLLM is Vulnerable: Cross-Modality Jailbreak and Mismatched Attacks on Medical Multimodal Large Language Models
di: Huang, Xijie, et al.
Pubblicazione: (2024) -
SoPo: Text-to-Motion Generation Using Semi-Online Preference Optimization
di: Tan, Xiaofeng, et al.
Pubblicazione: (2024) -
Scalable Ranked Preference Optimization for Text-to-Image Generation
di: Karthik, Shyamgopal, et al.
Pubblicazione: (2024) -
LightM-UNet: Mamba Assists in Lightweight UNet for Medical Image Segmentation
di: Liao, Weibin, et al.
Pubblicazione: (2024) -
Rich Human Feedback for Text-to-Image Generation
di: Liang, Youwei, et al.
Pubblicazione: (2023)