Enregistré dans:
| Auteurs principaux: | Cho, Wonwoong, Zhang, Yanxia, Chen, Yan-Ying, Inouye, David I. |
|---|---|
| Format: | Preprint |
| Publié: |
2025
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2506.24085 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
Att-Adapter: A Robust and Precise Domain-Specific Multi-Attributes T2I Diffusion Adapter via Conditional Variational Autoencoder
par: Cho, Wonwoong, et autres
Publié: (2025)
par: Cho, Wonwoong, et autres
Publié: (2025)
Enhanced Controllability of Diffusion Models via Feature Disentanglement and Realism-Enhanced Sampling Methods
par: Cho, Wonwoong, et autres
Publié: (2023)
par: Cho, Wonwoong, et autres
Publié: (2023)
Plug-and-Play Multi-Concept Adaptive Blending for High-Fidelity Text-to-Image Synthesis
par: Woo, Young-Beom
Publié: (2025)
par: Woo, Young-Beom
Publié: (2025)
PFB-Diff: Progressive Feature Blending Diffusion for Text-driven Image Editing
par: Huang, Wenjing, et autres
Publié: (2023)
par: Huang, Wenjing, et autres
Publié: (2023)
TP-Blend: Textual-Prompt Attention Pairing for Precise Object-Style Blending in Diffusion Models
par: Jin, Xin, et autres
Publié: (2026)
par: Jin, Xin, et autres
Publié: (2026)
How to Blend Concepts in Diffusion Models
par: Olearo, Lorenzo, et autres
Publié: (2024)
par: Olearo, Lorenzo, et autres
Publié: (2024)
Mosaic: Compositional Multi-Concept Erasure via Vector Field Blending
par: Ko, Junseok, et autres
Publié: (2026)
par: Ko, Junseok, et autres
Publié: (2026)
Your VAR Model is Secretly an Efficient and Explainable Generative Classifier
par: Chen, Yi-Chung, et autres
Publié: (2025)
par: Chen, Yi-Chung, et autres
Publié: (2025)
Evidential Graph Contrastive Alignment for Source-Free Blending-Target Domain Adaptation
par: Zheng, Juepeng, et autres
Publié: (2024)
par: Zheng, Juepeng, et autres
Publié: (2024)
StarCraftImage: A Dataset For Prototyping Spatial Reasoning Methods For Multi-Agent Environments
par: Kulinski, Sean, et autres
Publié: (2024)
par: Kulinski, Sean, et autres
Publié: (2024)
Ordering Matters: Rank-Aware Selective Fusion for Blended Emotion Recognition
par: Lee, Junghyun, et autres
Publié: (2026)
par: Lee, Junghyun, et autres
Publié: (2026)
Diffusion Blend: Inference-Time Multi-Preference Alignment for Diffusion Models
par: Cheng, Min, et autres
Publié: (2025)
par: Cheng, Min, et autres
Publié: (2025)
Automated Prompt Generation for Creative and Counterfactual Text-to-image Synthesis
par: Jelaca, Aleksa, et autres
Publié: (2025)
par: Jelaca, Aleksa, et autres
Publié: (2025)
RealGen: Photorealistic Text-to-Image Generation via Detector-Guided Rewards
par: Ye, Junyan, et autres
Publié: (2025)
par: Ye, Junyan, et autres
Publié: (2025)
CreativeSynth: Cross-Art-Attention for Artistic Image Synthesis with Multimodal Diffusion
par: Huang, Nisha, et autres
Publié: (2024)
par: Huang, Nisha, et autres
Publié: (2024)
Imagine yourself: Tuning-Free Personalized Image Generation
par: He, Zecheng, et autres
Publié: (2024)
par: He, Zecheng, et autres
Publié: (2024)
Blending 3D Geometry and Machine Learning for Multi-View Stereopsis
par: Vats, Vibhas, et autres
Publié: (2025)
par: Vats, Vibhas, et autres
Publié: (2025)
Improving Text-to-Image Generation with Intrinsic Self-Confidence Rewards
par: Kim, Seungwook, et autres
Publié: (2026)
par: Kim, Seungwook, et autres
Publié: (2026)
AID: Attention Interpolation of Text-to-Image Diffusion
par: He, Qiyuan, et autres
Publié: (2024)
par: He, Qiyuan, et autres
Publié: (2024)
Don't Deceive Me: Mitigating Gaslighting through Attention Reallocation in LMMs
par: Jiao, Pengkun, et autres
Publié: (2025)
par: Jiao, Pengkun, et autres
Publié: (2025)
UrbanCross: Enhancing Satellite Image-Text Retrieval with Cross-Domain Adaptation
par: Zhong, Siru, et autres
Publié: (2024)
par: Zhong, Siru, et autres
Publié: (2024)
Blending adversarial training and representation-conditional purification via aggregation improves adversarial robustness
par: Ballarin, Emanuele, et autres
Publié: (2023)
par: Ballarin, Emanuele, et autres
Publié: (2023)
ShotFinder: Imagination-Driven Open-Domain Video Shot Retrieval via Web Search
par: Yu, Tao, et autres
Publié: (2026)
par: Yu, Tao, et autres
Publié: (2026)
UNCAGE: Contrastive Attention Guidance for Masked Generative Transformers in Text-to-Image Generation
par: Kang, Wonjun, et autres
Publié: (2025)
par: Kang, Wonjun, et autres
Publié: (2025)
SurFhead: Affine Rig Blending for Geometrically Accurate 2D Gaussian Surfel Head Avatars
par: Lee, Jaeseong, et autres
Publié: (2024)
par: Lee, Jaeseong, et autres
Publié: (2024)
Retain, Blend, and Exchange: A Quality-aware Spatial-Stereo Fusion Approach for Event Stream Recognition
par: Chen, Lan, et autres
Publié: (2024)
par: Chen, Lan, et autres
Publié: (2024)
Repairing Catastrophic-Neglect in Text-to-Image Diffusion Models via Attention-Guided Feature Enhancement
par: Chang, Zhiyuan, et autres
Publié: (2024)
par: Chang, Zhiyuan, et autres
Publié: (2024)
Image Clustering Conditioned on Text Criteria
par: Kwon, Sehyun, et autres
Publié: (2023)
par: Kwon, Sehyun, et autres
Publié: (2023)
Blending Concepts with Text-to-Image Diffusion Models
par: Olearo, Lorenzo, et autres
Publié: (2025)
par: Olearo, Lorenzo, et autres
Publié: (2025)
Do You Keep an Eye on What I Ask? Mitigating Multimodal Hallucination via Attention-Guided Ensemble Decoding
par: Cho, Yeongjae, et autres
Publié: (2025)
par: Cho, Yeongjae, et autres
Publié: (2025)
Enhancing Text-to-Image Diffusion Transformer via Split-Text Conditioning
par: Zhang, Yu, et autres
Publié: (2025)
par: Zhang, Yu, et autres
Publié: (2025)
PIA: Your Personalized Image Animator via Plug-and-Play Modules in Text-to-Image Models
par: Zhang, Yiming, et autres
Publié: (2023)
par: Zhang, Yiming, et autres
Publié: (2023)
TFANet: Three-Stage Image-Text Feature Alignment Network for Robust Referring Image Segmentation
par: Lu, Qianqi, et autres
Publié: (2025)
par: Lu, Qianqi, et autres
Publié: (2025)
VIPA: Visual Informative Part Attention for Referring Image Segmentation
par: Cho, Yubin, et autres
Publié: (2026)
par: Cho, Yubin, et autres
Publié: (2026)
Prompt Decoupling for Text-to-Image Person Re-identification
par: Li, Weihao, et autres
Publié: (2024)
par: Li, Weihao, et autres
Publié: (2024)
GRAFNet: Multiscale Retinal Processing via Guided Cortical Attention Feedback for Enhancing Medical Image Polyp Segmentation
par: Fofanah, Abdul Joseph, et autres
Publié: (2026)
par: Fofanah, Abdul Joseph, et autres
Publié: (2026)
Personalized Safety Alignment for Text-to-Image Diffusion Models
par: Lei, Yu, et autres
Publié: (2025)
par: Lei, Yu, et autres
Publié: (2025)
15M Multimodal Facial Image-Text Dataset
par: Dai, Dawei, et autres
Publié: (2024)
par: Dai, Dawei, et autres
Publié: (2024)
YOLOv12: Attention-Centric Real-Time Object Detectors
par: Tian, Yunjie, et autres
Publié: (2025)
par: Tian, Yunjie, et autres
Publié: (2025)
FlexGen: Flexible Multi-View Generation from Text and Image Inputs
par: Xu, Xinli, et autres
Publié: (2024)
par: Xu, Xinli, et autres
Publié: (2024)
Documents similaires
-
Att-Adapter: A Robust and Precise Domain-Specific Multi-Attributes T2I Diffusion Adapter via Conditional Variational Autoencoder
par: Cho, Wonwoong, et autres
Publié: (2025) -
Enhanced Controllability of Diffusion Models via Feature Disentanglement and Realism-Enhanced Sampling Methods
par: Cho, Wonwoong, et autres
Publié: (2023) -
Plug-and-Play Multi-Concept Adaptive Blending for High-Fidelity Text-to-Image Synthesis
par: Woo, Young-Beom
Publié: (2025) -
PFB-Diff: Progressive Feature Blending Diffusion for Text-driven Image Editing
par: Huang, Wenjing, et autres
Publié: (2023) -
TP-Blend: Textual-Prompt Attention Pairing for Precise Object-Style Blending in Diffusion Models
par: Jin, Xin, et autres
Publié: (2026)