:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autori principali:	Zhang, Yuxi, Li, Yueting, Du, Xinyu, Wang, Sibo
Natura:	Preprint
Pubblicazione:	2025
Soggetti:	Computer Vision and Pattern Recognition
Accesso online:	https://arxiv.org/abs/2505.22792
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

Image Regeneration: Evaluating Text-to-Image Model via Generating Identical Image with Multimodal Large Language Models
di: Meng, Chutian, et al.
Pubblicazione: (2024)

Dense2MoE: Restructuring Diffusion Transformer to MoE for Efficient Text-to-Image Generation
di: Zheng, Youwei, et al.
Pubblicazione: (2025)

ViSTA: Visual Storytelling using Multi-modal Adapters for Text-to-Image Diffusion Models
di: Dong, Sibo, et al.
Pubblicazione: (2025)

GACO-CAD: Geometry-Augmented and Conciseness-Optimized CAD Model Generation from Single Image
di: Wang, Yinghui, et al.
Pubblicazione: (2025)

Detect-and-Guide: Self-regulation of Diffusion Models for Safe Text-to-Image Generation via Guideline Token Optimization
di: Li, Feifei, et al.
Pubblicazione: (2025)

More Than Generation: Unifying Generation and Depth Estimation via Text-to-Image Diffusion Models
di: Lin, Hongkai, et al.
Pubblicazione: (2025)

Parallel Diffusion Solver via Residual Dirichlet Policy Optimization
di: Wang, Ruoyu, et al.
Pubblicazione: (2025)

Disciplined Diffusion: Text-to-Image Diffusion Model against NSFW Generation
di: Zhang, Chi, et al.
Pubblicazione: (2026)

MegaStyle: Constructing Diverse and Scalable Style Dataset via Consistent Text-to-Image Style Mapping
di: Gao, Junyao, et al.
Pubblicazione: (2026)

AITTI: Learning Adaptive Inclusive Token for Text-to-Image Generation
di: Hou, Xinyu, et al.
Pubblicazione: (2024)

InitNO: Boosting Text-to-Image Diffusion Models via Initial Noise Optimization
di: Guo, Xiefan, et al.
Pubblicazione: (2024)

Generalized Visual Relation Detection with Diffusion Models
di: Gao, Kaifeng, et al.
Pubblicazione: (2025)

Instructing Text-to-Image Diffusion Models via Classifier-Guided Semantic Optimization
di: Chang, Yuanyuan, et al.
Pubblicazione: (2025)

CEIDM: A Controlled Entity and Interaction Diffusion Model for Enhanced Text-to-Image Generation
di: Yang, Mingyue, et al.
Pubblicazione: (2025)

DriveGEN: Generalized and Robust 3D Detection in Driving via Controllable Text-to-Image Diffusion Generation
di: Lin, Hongbin, et al.
Pubblicazione: (2025)

LASER: Tuning-Free LLM-Driven Attention Control for Efficient Text-conditioned Image-to-Animation
di: Zheng, Haoyu, et al.
Pubblicazione: (2024)

Curriculum Group Policy Optimization: Adaptive Sampling for Unleashing the Potential of Text-to-Image Generation
di: Li, Baoteng, et al.
Pubblicazione: (2026)

Enhancing Text-to-Image Diffusion Transformer via Split-Text Conditioning
di: Zhang, Yu, et al.
Pubblicazione: (2025)

DesignDiffusion: High-Quality Text-to-Design Image Generation with Diffusion Models
di: Wang, Zhendong, et al.
Pubblicazione: (2025)

FocusDiff: Advancing Fine-Grained Text-Image Alignment for Autoregressive Visual Generation through RL
di: Pan, Kaihang, et al.
Pubblicazione: (2025)

Universal Prompt Optimizer for Safe Text-to-Image Generation
di: Wu, Zongyu, et al.
Pubblicazione: (2024)

LayerDiff: Exploring Text-guided Multi-layered Composable Image Synthesis via Layer-Collaborative Diffusion Model
di: Huang, Runhui, et al.
Pubblicazione: (2024)

Optimizing Prompts for Text-to-Image Generation
di: Hao, Yaru, et al.
Pubblicazione: (2022)

Multilingual Text-to-Image Person Retrieval via Bidirectional Relation Reasoning and Aligning
di: Cao, Min, et al.
Pubblicazione: (2025)

Energy-Guided Optimization for Personalized Image Editing with Pretrained Text-to-Image Diffusion Models
di: Jiang, Rui, et al.
Pubblicazione: (2025)

RAPHAEL: Text-to-Image Generation via Large Mixture of Diffusion Paths
di: Xue, Zeyue, et al.
Pubblicazione: (2023)

Isolated Diffusion: Optimizing Multi-Concept Text-to-Image Generation Training-Freely with Isolated Diffusion Guidance
di: Zhu, Jingyuan, et al.
Pubblicazione: (2024)

Bayesian-Optimized One-Step Diffusion Model with Knowledge Distillation for Real-Time 3D Human Motion Prediction
di: Tian, Sibo, et al.
Pubblicazione: (2024)

Reusing Computation in Text-to-Image Diffusion for Efficient Generation of Image Sets
di: Decatur, Dale, et al.
Pubblicazione: (2025)

From Reflection to Perfection: Scaling Inference-Time Optimization for Text-to-Image Diffusion Models via Reflection Tuning
di: Zhuo, Le, et al.
Pubblicazione: (2025)

Unsupervised Multimodal 3D Medical Image Registration with Multilevel Correlation Balanced Optimization
di: Wang, Jiazheng, et al.
Pubblicazione: (2024)

Diffusion-based Blind Text Image Super-Resolution
di: Zhang, Yuzhe, et al.
Pubblicazione: (2023)

Improving Long-Text Alignment for Text-to-Image Diffusion Models
di: Liu, Luping, et al.
Pubblicazione: (2024)

Leveraging Text-to-Image Diffusion Models for Unsupervised Visual Object Tracking
di: Zhang, Zhengbo, et al.
Pubblicazione: (2026)

SpatialFusion: Endowing Unified Image Generation with Intrinsic 3D Geometric Awareness
di: Qiu, Haiyi, et al.
Pubblicazione: (2026)

CogView3: Finer and Faster Text-to-Image Generation via Relay Diffusion
di: Zheng, Wendi, et al.
Pubblicazione: (2024)

Towards Unified Multimodal Interleaved Generation via Group Relative Policy Optimization
di: Nie, Ming, et al.
Pubblicazione: (2026)

AnomalyDiffusion: Few-Shot Anomaly Image Generation with Diffusion Model
di: Hu, Teng, et al.
Pubblicazione: (2023)

Policy Optimized Text-to-Image Pipeline Design
di: Gadot, Uri, et al.
Pubblicazione: (2025)

Tag2Text: Guiding Vision-Language Model via Image Tagging
di: Huang, Xinyu, et al.
Pubblicazione: (2023)