:: Library Catalog

Image de couverture de livre

Enregistré dans:

Détails bibliographiques
Auteurs principaux:	Cho, Wonwoong, Zhang, Yanxia, Chen, Yan-Ying, Inouye, David I.
Format:	Preprint
Publié:	2025
Sujets:	Computer Vision and Pattern Recognition Artificial Intelligence
Accès en ligne:	https://arxiv.org/abs/2506.24085
Tags:	Ajouter un tag Pas de tags, Soyez le premier à ajouter un tag!

Documents similaires

Att-Adapter: A Robust and Precise Domain-Specific Multi-Attributes T2I Diffusion Adapter via Conditional Variational Autoencoder
par: Cho, Wonwoong, et autres
Publié: (2025)

Enhanced Controllability of Diffusion Models via Feature Disentanglement and Realism-Enhanced Sampling Methods
par: Cho, Wonwoong, et autres
Publié: (2023)

Plug-and-Play Multi-Concept Adaptive Blending for High-Fidelity Text-to-Image Synthesis
par: Woo, Young-Beom
Publié: (2025)

PFB-Diff: Progressive Feature Blending Diffusion for Text-driven Image Editing
par: Huang, Wenjing, et autres
Publié: (2023)

TP-Blend: Textual-Prompt Attention Pairing for Precise Object-Style Blending in Diffusion Models
par: Jin, Xin, et autres
Publié: (2026)

How to Blend Concepts in Diffusion Models
par: Olearo, Lorenzo, et autres
Publié: (2024)

Mosaic: Compositional Multi-Concept Erasure via Vector Field Blending
par: Ko, Junseok, et autres
Publié: (2026)

Your VAR Model is Secretly an Efficient and Explainable Generative Classifier
par: Chen, Yi-Chung, et autres
Publié: (2025)

Evidential Graph Contrastive Alignment for Source-Free Blending-Target Domain Adaptation
par: Zheng, Juepeng, et autres
Publié: (2024)

StarCraftImage: A Dataset For Prototyping Spatial Reasoning Methods For Multi-Agent Environments
par: Kulinski, Sean, et autres
Publié: (2024)

Ordering Matters: Rank-Aware Selective Fusion for Blended Emotion Recognition
par: Lee, Junghyun, et autres
Publié: (2026)

Diffusion Blend: Inference-Time Multi-Preference Alignment for Diffusion Models
par: Cheng, Min, et autres
Publié: (2025)

Automated Prompt Generation for Creative and Counterfactual Text-to-image Synthesis
par: Jelaca, Aleksa, et autres
Publié: (2025)

RealGen: Photorealistic Text-to-Image Generation via Detector-Guided Rewards
par: Ye, Junyan, et autres
Publié: (2025)

CreativeSynth: Cross-Art-Attention for Artistic Image Synthesis with Multimodal Diffusion
par: Huang, Nisha, et autres
Publié: (2024)

Imagine yourself: Tuning-Free Personalized Image Generation
par: He, Zecheng, et autres
Publié: (2024)

Blending 3D Geometry and Machine Learning for Multi-View Stereopsis
par: Vats, Vibhas, et autres
Publié: (2025)

Improving Text-to-Image Generation with Intrinsic Self-Confidence Rewards
par: Kim, Seungwook, et autres
Publié: (2026)

AID: Attention Interpolation of Text-to-Image Diffusion
par: He, Qiyuan, et autres
Publié: (2024)

Don't Deceive Me: Mitigating Gaslighting through Attention Reallocation in LMMs
par: Jiao, Pengkun, et autres
Publié: (2025)

UrbanCross: Enhancing Satellite Image-Text Retrieval with Cross-Domain Adaptation
par: Zhong, Siru, et autres
Publié: (2024)

Blending adversarial training and representation-conditional purification via aggregation improves adversarial robustness
par: Ballarin, Emanuele, et autres
Publié: (2023)

ShotFinder: Imagination-Driven Open-Domain Video Shot Retrieval via Web Search
par: Yu, Tao, et autres
Publié: (2026)

UNCAGE: Contrastive Attention Guidance for Masked Generative Transformers in Text-to-Image Generation
par: Kang, Wonjun, et autres
Publié: (2025)

SurFhead: Affine Rig Blending for Geometrically Accurate 2D Gaussian Surfel Head Avatars
par: Lee, Jaeseong, et autres
Publié: (2024)

Retain, Blend, and Exchange: A Quality-aware Spatial-Stereo Fusion Approach for Event Stream Recognition
par: Chen, Lan, et autres
Publié: (2024)

Repairing Catastrophic-Neglect in Text-to-Image Diffusion Models via Attention-Guided Feature Enhancement
par: Chang, Zhiyuan, et autres
Publié: (2024)

Image Clustering Conditioned on Text Criteria
par: Kwon, Sehyun, et autres
Publié: (2023)

Blending Concepts with Text-to-Image Diffusion Models
par: Olearo, Lorenzo, et autres
Publié: (2025)

Do You Keep an Eye on What I Ask? Mitigating Multimodal Hallucination via Attention-Guided Ensemble Decoding
par: Cho, Yeongjae, et autres
Publié: (2025)

Enhancing Text-to-Image Diffusion Transformer via Split-Text Conditioning
par: Zhang, Yu, et autres
Publié: (2025)

PIA: Your Personalized Image Animator via Plug-and-Play Modules in Text-to-Image Models
par: Zhang, Yiming, et autres
Publié: (2023)

TFANet: Three-Stage Image-Text Feature Alignment Network for Robust Referring Image Segmentation
par: Lu, Qianqi, et autres
Publié: (2025)

VIPA: Visual Informative Part Attention for Referring Image Segmentation
par: Cho, Yubin, et autres
Publié: (2026)

Prompt Decoupling for Text-to-Image Person Re-identification
par: Li, Weihao, et autres
Publié: (2024)

GRAFNet: Multiscale Retinal Processing via Guided Cortical Attention Feedback for Enhancing Medical Image Polyp Segmentation
par: Fofanah, Abdul Joseph, et autres
Publié: (2026)

Personalized Safety Alignment for Text-to-Image Diffusion Models
par: Lei, Yu, et autres
Publié: (2025)

15M Multimodal Facial Image-Text Dataset
par: Dai, Dawei, et autres
Publié: (2024)

YOLOv12: Attention-Centric Real-Time Object Detectors
par: Tian, Yunjie, et autres
Publié: (2025)

FlexGen: Flexible Multi-View Generation from Text and Image Inputs
par: Xu, Xinli, et autres
Publié: (2024)