Salvato in:
| Autori principali: | Zhang, Yuxi, Li, Yueting, Du, Xinyu, Wang, Sibo |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2025
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2505.22792 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
Image Regeneration: Evaluating Text-to-Image Model via Generating Identical Image with Multimodal Large Language Models
di: Meng, Chutian, et al.
Pubblicazione: (2024)
di: Meng, Chutian, et al.
Pubblicazione: (2024)
Dense2MoE: Restructuring Diffusion Transformer to MoE for Efficient Text-to-Image Generation
di: Zheng, Youwei, et al.
Pubblicazione: (2025)
di: Zheng, Youwei, et al.
Pubblicazione: (2025)
ViSTA: Visual Storytelling using Multi-modal Adapters for Text-to-Image Diffusion Models
di: Dong, Sibo, et al.
Pubblicazione: (2025)
di: Dong, Sibo, et al.
Pubblicazione: (2025)
GACO-CAD: Geometry-Augmented and Conciseness-Optimized CAD Model Generation from Single Image
di: Wang, Yinghui, et al.
Pubblicazione: (2025)
di: Wang, Yinghui, et al.
Pubblicazione: (2025)
Detect-and-Guide: Self-regulation of Diffusion Models for Safe Text-to-Image Generation via Guideline Token Optimization
di: Li, Feifei, et al.
Pubblicazione: (2025)
di: Li, Feifei, et al.
Pubblicazione: (2025)
More Than Generation: Unifying Generation and Depth Estimation via Text-to-Image Diffusion Models
di: Lin, Hongkai, et al.
Pubblicazione: (2025)
di: Lin, Hongkai, et al.
Pubblicazione: (2025)
Parallel Diffusion Solver via Residual Dirichlet Policy Optimization
di: Wang, Ruoyu, et al.
Pubblicazione: (2025)
di: Wang, Ruoyu, et al.
Pubblicazione: (2025)
Disciplined Diffusion: Text-to-Image Diffusion Model against NSFW Generation
di: Zhang, Chi, et al.
Pubblicazione: (2026)
di: Zhang, Chi, et al.
Pubblicazione: (2026)
MegaStyle: Constructing Diverse and Scalable Style Dataset via Consistent Text-to-Image Style Mapping
di: Gao, Junyao, et al.
Pubblicazione: (2026)
di: Gao, Junyao, et al.
Pubblicazione: (2026)
AITTI: Learning Adaptive Inclusive Token for Text-to-Image Generation
di: Hou, Xinyu, et al.
Pubblicazione: (2024)
di: Hou, Xinyu, et al.
Pubblicazione: (2024)
InitNO: Boosting Text-to-Image Diffusion Models via Initial Noise Optimization
di: Guo, Xiefan, et al.
Pubblicazione: (2024)
di: Guo, Xiefan, et al.
Pubblicazione: (2024)
Generalized Visual Relation Detection with Diffusion Models
di: Gao, Kaifeng, et al.
Pubblicazione: (2025)
di: Gao, Kaifeng, et al.
Pubblicazione: (2025)
Instructing Text-to-Image Diffusion Models via Classifier-Guided Semantic Optimization
di: Chang, Yuanyuan, et al.
Pubblicazione: (2025)
di: Chang, Yuanyuan, et al.
Pubblicazione: (2025)
CEIDM: A Controlled Entity and Interaction Diffusion Model for Enhanced Text-to-Image Generation
di: Yang, Mingyue, et al.
Pubblicazione: (2025)
di: Yang, Mingyue, et al.
Pubblicazione: (2025)
DriveGEN: Generalized and Robust 3D Detection in Driving via Controllable Text-to-Image Diffusion Generation
di: Lin, Hongbin, et al.
Pubblicazione: (2025)
di: Lin, Hongbin, et al.
Pubblicazione: (2025)
LASER: Tuning-Free LLM-Driven Attention Control for Efficient Text-conditioned Image-to-Animation
di: Zheng, Haoyu, et al.
Pubblicazione: (2024)
di: Zheng, Haoyu, et al.
Pubblicazione: (2024)
Curriculum Group Policy Optimization: Adaptive Sampling for Unleashing the Potential of Text-to-Image Generation
di: Li, Baoteng, et al.
Pubblicazione: (2026)
di: Li, Baoteng, et al.
Pubblicazione: (2026)
Enhancing Text-to-Image Diffusion Transformer via Split-Text Conditioning
di: Zhang, Yu, et al.
Pubblicazione: (2025)
di: Zhang, Yu, et al.
Pubblicazione: (2025)
DesignDiffusion: High-Quality Text-to-Design Image Generation with Diffusion Models
di: Wang, Zhendong, et al.
Pubblicazione: (2025)
di: Wang, Zhendong, et al.
Pubblicazione: (2025)
FocusDiff: Advancing Fine-Grained Text-Image Alignment for Autoregressive Visual Generation through RL
di: Pan, Kaihang, et al.
Pubblicazione: (2025)
di: Pan, Kaihang, et al.
Pubblicazione: (2025)
Universal Prompt Optimizer for Safe Text-to-Image Generation
di: Wu, Zongyu, et al.
Pubblicazione: (2024)
di: Wu, Zongyu, et al.
Pubblicazione: (2024)
LayerDiff: Exploring Text-guided Multi-layered Composable Image Synthesis via Layer-Collaborative Diffusion Model
di: Huang, Runhui, et al.
Pubblicazione: (2024)
di: Huang, Runhui, et al.
Pubblicazione: (2024)
Optimizing Prompts for Text-to-Image Generation
di: Hao, Yaru, et al.
Pubblicazione: (2022)
di: Hao, Yaru, et al.
Pubblicazione: (2022)
Multilingual Text-to-Image Person Retrieval via Bidirectional Relation Reasoning and Aligning
di: Cao, Min, et al.
Pubblicazione: (2025)
di: Cao, Min, et al.
Pubblicazione: (2025)
Energy-Guided Optimization for Personalized Image Editing with Pretrained Text-to-Image Diffusion Models
di: Jiang, Rui, et al.
Pubblicazione: (2025)
di: Jiang, Rui, et al.
Pubblicazione: (2025)
RAPHAEL: Text-to-Image Generation via Large Mixture of Diffusion Paths
di: Xue, Zeyue, et al.
Pubblicazione: (2023)
di: Xue, Zeyue, et al.
Pubblicazione: (2023)
Isolated Diffusion: Optimizing Multi-Concept Text-to-Image Generation Training-Freely with Isolated Diffusion Guidance
di: Zhu, Jingyuan, et al.
Pubblicazione: (2024)
di: Zhu, Jingyuan, et al.
Pubblicazione: (2024)
Bayesian-Optimized One-Step Diffusion Model with Knowledge Distillation for Real-Time 3D Human Motion Prediction
di: Tian, Sibo, et al.
Pubblicazione: (2024)
di: Tian, Sibo, et al.
Pubblicazione: (2024)
Reusing Computation in Text-to-Image Diffusion for Efficient Generation of Image Sets
di: Decatur, Dale, et al.
Pubblicazione: (2025)
di: Decatur, Dale, et al.
Pubblicazione: (2025)
From Reflection to Perfection: Scaling Inference-Time Optimization for Text-to-Image Diffusion Models via Reflection Tuning
di: Zhuo, Le, et al.
Pubblicazione: (2025)
di: Zhuo, Le, et al.
Pubblicazione: (2025)
Unsupervised Multimodal 3D Medical Image Registration with Multilevel Correlation Balanced Optimization
di: Wang, Jiazheng, et al.
Pubblicazione: (2024)
di: Wang, Jiazheng, et al.
Pubblicazione: (2024)
Diffusion-based Blind Text Image Super-Resolution
di: Zhang, Yuzhe, et al.
Pubblicazione: (2023)
di: Zhang, Yuzhe, et al.
Pubblicazione: (2023)
Improving Long-Text Alignment for Text-to-Image Diffusion Models
di: Liu, Luping, et al.
Pubblicazione: (2024)
di: Liu, Luping, et al.
Pubblicazione: (2024)
Leveraging Text-to-Image Diffusion Models for Unsupervised Visual Object Tracking
di: Zhang, Zhengbo, et al.
Pubblicazione: (2026)
di: Zhang, Zhengbo, et al.
Pubblicazione: (2026)
SpatialFusion: Endowing Unified Image Generation with Intrinsic 3D Geometric Awareness
di: Qiu, Haiyi, et al.
Pubblicazione: (2026)
di: Qiu, Haiyi, et al.
Pubblicazione: (2026)
CogView3: Finer and Faster Text-to-Image Generation via Relay Diffusion
di: Zheng, Wendi, et al.
Pubblicazione: (2024)
di: Zheng, Wendi, et al.
Pubblicazione: (2024)
Towards Unified Multimodal Interleaved Generation via Group Relative Policy Optimization
di: Nie, Ming, et al.
Pubblicazione: (2026)
di: Nie, Ming, et al.
Pubblicazione: (2026)
AnomalyDiffusion: Few-Shot Anomaly Image Generation with Diffusion Model
di: Hu, Teng, et al.
Pubblicazione: (2023)
di: Hu, Teng, et al.
Pubblicazione: (2023)
Policy Optimized Text-to-Image Pipeline Design
di: Gadot, Uri, et al.
Pubblicazione: (2025)
di: Gadot, Uri, et al.
Pubblicazione: (2025)
Tag2Text: Guiding Vision-Language Model via Image Tagging
di: Huang, Xinyu, et al.
Pubblicazione: (2023)
di: Huang, Xinyu, et al.
Pubblicazione: (2023)
Documenti analoghi
-
Image Regeneration: Evaluating Text-to-Image Model via Generating Identical Image with Multimodal Large Language Models
di: Meng, Chutian, et al.
Pubblicazione: (2024) -
Dense2MoE: Restructuring Diffusion Transformer to MoE for Efficient Text-to-Image Generation
di: Zheng, Youwei, et al.
Pubblicazione: (2025) -
ViSTA: Visual Storytelling using Multi-modal Adapters for Text-to-Image Diffusion Models
di: Dong, Sibo, et al.
Pubblicazione: (2025) -
GACO-CAD: Geometry-Augmented and Conciseness-Optimized CAD Model Generation from Single Image
di: Wang, Yinghui, et al.
Pubblicazione: (2025) -
Detect-and-Guide: Self-regulation of Diffusion Models for Safe Text-to-Image Generation via Guideline Token Optimization
di: Li, Feifei, et al.
Pubblicazione: (2025)