Salvato in:
| Autori principali: | Zhang, Jiexuan, Du, Yiheng, Wang, Qian, Li, Weiqi, Gu, Yu, Zhang, Jian |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2025
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2509.17088 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
AlignGen: Boosting Personalized Image Generation with Cross-Modality Prior Alignment
di: Lin, Yiheng, et al.
Pubblicazione: (2025)
di: Lin, Yiheng, et al.
Pubblicazione: (2025)
StyleAR: Customizing Multimodal Autoregressive Model for Style-Aligned Text-to-Image Generation
di: Wu, Yi, et al.
Pubblicazione: (2025)
di: Wu, Yi, et al.
Pubblicazione: (2025)
ReAlign: Generalizable Image Forgery Detection via Reasoning-Aligned Representation
di: Huang, Qing, et al.
Pubblicazione: (2026)
di: Huang, Qing, et al.
Pubblicazione: (2026)
Style Aligned Image Generation via Shared Attention
di: Hertz, Amir, et al.
Pubblicazione: (2023)
di: Hertz, Amir, et al.
Pubblicazione: (2023)
Style-Aligned Image Composition for Robust Detection of Abnormal Cells in Cytopathology
di: Qi, Qiuyi, et al.
Pubblicazione: (2025)
di: Qi, Qiuyi, et al.
Pubblicazione: (2025)
OmniGen2: Towards Instruction-Aligned Multimodal Generation
di: Wu, Chenyuan, et al.
Pubblicazione: (2025)
di: Wu, Chenyuan, et al.
Pubblicazione: (2025)
AlignCVC: Aligning Cross-View Consistency for Single-Image-to-3D Generation
di: Liang, Xinyue, et al.
Pubblicazione: (2025)
di: Liang, Xinyue, et al.
Pubblicazione: (2025)
RecipeGen: A Step-Aligned Multimodal Benchmark for Real-World Recipe Generation
di: Zhang, Ruoxuan, et al.
Pubblicazione: (2025)
di: Zhang, Ruoxuan, et al.
Pubblicazione: (2025)
Re-Align: Structured Reasoning-guided Alignment for In-Context Image Generation and Editing
di: He, Runze, et al.
Pubblicazione: (2026)
di: He, Runze, et al.
Pubblicazione: (2026)
GenArena: How Can We Achieve Human-Aligned Evaluation for Visual Generation Tasks?
di: Li, Ruihang, et al.
Pubblicazione: (2026)
di: Li, Ruihang, et al.
Pubblicazione: (2026)
PostAlign: Multimodal Grounding as a Corrective Lens for MLLMs
di: Wu, Yixuan, et al.
Pubblicazione: (2025)
di: Wu, Yixuan, et al.
Pubblicazione: (2025)
OmniDrag: Enabling Motion Control for Omnidirectional Image-to-Video Generation
di: Li, Weiqi, et al.
Pubblicazione: (2024)
di: Li, Weiqi, et al.
Pubblicazione: (2024)
AttnDreamBooth: Towards Text-Aligned Personalized Text-to-Image Generation
di: Pang, Lianyu, et al.
Pubblicazione: (2024)
di: Pang, Lianyu, et al.
Pubblicazione: (2024)
ArtCrafter: Text-Image Aligning Style Transfer via Embedding Reframing
di: Huang, Nisha, et al.
Pubblicazione: (2025)
di: Huang, Nisha, et al.
Pubblicazione: (2025)
CAST: Component-Aligned 3D Scene Reconstruction from an RGB Image
di: Yao, Kaixin, et al.
Pubblicazione: (2025)
di: Yao, Kaixin, et al.
Pubblicazione: (2025)
360DVD: Controllable Panorama Video Generation with 360-Degree Video Diffusion Model
di: Wang, Qian, et al.
Pubblicazione: (2024)
di: Wang, Qian, et al.
Pubblicazione: (2024)
AlignTok: Aligning Visual Foundation Encoders to Tokenizers for Diffusion Models
di: Chen, Bowei, et al.
Pubblicazione: (2025)
di: Chen, Bowei, et al.
Pubblicazione: (2025)
Learning to Align Generative Appearance Priors for Fine-grained Image Retrieval
di: Wang, Shijie, et al.
Pubblicazione: (2026)
di: Wang, Shijie, et al.
Pubblicazione: (2026)
StyleTextGen: Style-Conditioned Multilingual Scene Text Generation
di: Chen, Zeyu, et al.
Pubblicazione: (2026)
di: Chen, Zeyu, et al.
Pubblicazione: (2026)
TAMISeg: Text-Aligned Multi-scale Medical Image Segmentation with Semantic Encoder Distillation
di: Gao, Qiang, et al.
Pubblicazione: (2026)
di: Gao, Qiang, et al.
Pubblicazione: (2026)
EditRefiner: A Human-Aligned Agentic Framework for Image Editing Refinement
di: Xu, Zitong, et al.
Pubblicazione: (2026)
di: Xu, Zitong, et al.
Pubblicazione: (2026)
SeedEdit: Align Image Re-Generation to Image Editing
di: Shi, Yichun, et al.
Pubblicazione: (2024)
di: Shi, Yichun, et al.
Pubblicazione: (2024)
Asynchronous Denoising Diffusion Models for Aligning Text-to-Image Generation
di: Hu, Zijing, et al.
Pubblicazione: (2025)
di: Hu, Zijing, et al.
Pubblicazione: (2025)
Skill-Aligned Annotation for Reliable Evaluation in Text-to-Image Generation
di: Eldesokey, Abdelrahman, et al.
Pubblicazione: (2026)
di: Eldesokey, Abdelrahman, et al.
Pubblicazione: (2026)
UniTriGen: Unified Triplet Generation of Aligned Visible-Infrared-Label for Few-Shot RGB-T Semantic Segmentation
di: Zhou, Ping, et al.
Pubblicazione: (2026)
di: Zhou, Ping, et al.
Pubblicazione: (2026)
Style-NeRF2NeRF: 3D Style Transfer From Style-Aligned Multi-View Images
di: Fujiwara, Haruo, et al.
Pubblicazione: (2024)
di: Fujiwara, Haruo, et al.
Pubblicazione: (2024)
Driving-Video Dehazing with Non-Aligned Regularization for Safety Assistance
di: Fan, Junkai, et al.
Pubblicazione: (2024)
di: Fan, Junkai, et al.
Pubblicazione: (2024)
Pixal3D: Pixel-Aligned 3D Generation from Images
di: Li, Dong-Yang, et al.
Pubblicazione: (2026)
di: Li, Dong-Yang, et al.
Pubblicazione: (2026)
PhaSR: Generalized Image Shadow Removal with Physically Aligned Priors
di: Lee, Chia-Ming, et al.
Pubblicazione: (2026)
di: Lee, Chia-Ming, et al.
Pubblicazione: (2026)
SAQ-SAM: Semantically-Aligned Quantization for Segment Anything Model
di: Zhang, Jing, et al.
Pubblicazione: (2025)
di: Zhang, Jing, et al.
Pubblicazione: (2025)
Aligning Medical Images with General Knowledge from Large Language Models
di: Fang, Xiao, et al.
Pubblicazione: (2024)
di: Fang, Xiao, et al.
Pubblicazione: (2024)
AGHI-QA: A Subjective-Aligned Dataset and Metric for AI-Generated Human Images
di: Li, Yunhao, et al.
Pubblicazione: (2025)
di: Li, Yunhao, et al.
Pubblicazione: (2025)
Parallax to Align Them All: An OmniParallax Attention Mechanism for Distributed Multi-View Image Compression
di: Zhang, Haotian, et al.
Pubblicazione: (2026)
di: Zhang, Haotian, et al.
Pubblicazione: (2026)
Align Beyond Prompts: Evaluating World Knowledge Alignment in Text-to-Image Generation
di: Zhang, Wenchao, et al.
Pubblicazione: (2025)
di: Zhang, Wenchao, et al.
Pubblicazione: (2025)
Align-DETR: Enhancing End-to-end Object Detection with Aligned Loss
di: Cai, Zhi, et al.
Pubblicazione: (2023)
di: Cai, Zhi, et al.
Pubblicazione: (2023)
Fusion in Your Way: Aligning Image Fusion with Heterogeneous Demands via Direct Preference Optimization
di: Su, Weijian, et al.
Pubblicazione: (2026)
di: Su, Weijian, et al.
Pubblicazione: (2026)
Disentangle-then-Align: Non-Iterative Hybrid Multimodal Image Registration via Cross-Scale Feature Disentanglement
di: Zhang, Chunlei, et al.
Pubblicazione: (2026)
di: Zhang, Chunlei, et al.
Pubblicazione: (2026)
ChatGen: Automatic Text-to-Image Generation From FreeStyle Chatting
di: Jia, Chengyou, et al.
Pubblicazione: (2024)
di: Jia, Chengyou, et al.
Pubblicazione: (2024)
Video-Bench: Human-Aligned Video Generation Benchmark
di: Han, Hui, et al.
Pubblicazione: (2025)
di: Han, Hui, et al.
Pubblicazione: (2025)
MIND-Edit: MLLM Insight-Driven Editing via Language-Vision Projection
di: Wang, Shuyu, et al.
Pubblicazione: (2025)
di: Wang, Shuyu, et al.
Pubblicazione: (2025)
Documenti analoghi
-
AlignGen: Boosting Personalized Image Generation with Cross-Modality Prior Alignment
di: Lin, Yiheng, et al.
Pubblicazione: (2025) -
StyleAR: Customizing Multimodal Autoregressive Model for Style-Aligned Text-to-Image Generation
di: Wu, Yi, et al.
Pubblicazione: (2025) -
ReAlign: Generalizable Image Forgery Detection via Reasoning-Aligned Representation
di: Huang, Qing, et al.
Pubblicazione: (2026) -
Style Aligned Image Generation via Shared Attention
di: Hertz, Amir, et al.
Pubblicazione: (2023) -
Style-Aligned Image Composition for Robust Detection of Abnormal Cells in Cytopathology
di: Qi, Qiuyi, et al.
Pubblicazione: (2025)