:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autori principali:	Zhang, Jiexuan, Du, Yiheng, Wang, Qian, Li, Weiqi, Gu, Yu, Zhang, Jian
Natura:	Preprint
Pubblicazione:	2025
Soggetti:	Computer Vision and Pattern Recognition
Accesso online:	https://arxiv.org/abs/2509.17088
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

AlignGen: Boosting Personalized Image Generation with Cross-Modality Prior Alignment
di: Lin, Yiheng, et al.
Pubblicazione: (2025)

StyleAR: Customizing Multimodal Autoregressive Model for Style-Aligned Text-to-Image Generation
di: Wu, Yi, et al.
Pubblicazione: (2025)

ReAlign: Generalizable Image Forgery Detection via Reasoning-Aligned Representation
di: Huang, Qing, et al.
Pubblicazione: (2026)

Style Aligned Image Generation via Shared Attention
di: Hertz, Amir, et al.
Pubblicazione: (2023)

Style-Aligned Image Composition for Robust Detection of Abnormal Cells in Cytopathology
di: Qi, Qiuyi, et al.
Pubblicazione: (2025)

OmniGen2: Towards Instruction-Aligned Multimodal Generation
di: Wu, Chenyuan, et al.
Pubblicazione: (2025)

AlignCVC: Aligning Cross-View Consistency for Single-Image-to-3D Generation
di: Liang, Xinyue, et al.
Pubblicazione: (2025)

RecipeGen: A Step-Aligned Multimodal Benchmark for Real-World Recipe Generation
di: Zhang, Ruoxuan, et al.
Pubblicazione: (2025)

Re-Align: Structured Reasoning-guided Alignment for In-Context Image Generation and Editing
di: He, Runze, et al.
Pubblicazione: (2026)

GenArena: How Can We Achieve Human-Aligned Evaluation for Visual Generation Tasks?
di: Li, Ruihang, et al.
Pubblicazione: (2026)

PostAlign: Multimodal Grounding as a Corrective Lens for MLLMs
di: Wu, Yixuan, et al.
Pubblicazione: (2025)

OmniDrag: Enabling Motion Control for Omnidirectional Image-to-Video Generation
di: Li, Weiqi, et al.
Pubblicazione: (2024)

AttnDreamBooth: Towards Text-Aligned Personalized Text-to-Image Generation
di: Pang, Lianyu, et al.
Pubblicazione: (2024)

ArtCrafter: Text-Image Aligning Style Transfer via Embedding Reframing
di: Huang, Nisha, et al.
Pubblicazione: (2025)

CAST: Component-Aligned 3D Scene Reconstruction from an RGB Image
di: Yao, Kaixin, et al.
Pubblicazione: (2025)

360DVD: Controllable Panorama Video Generation with 360-Degree Video Diffusion Model
di: Wang, Qian, et al.
Pubblicazione: (2024)

AlignTok: Aligning Visual Foundation Encoders to Tokenizers for Diffusion Models
di: Chen, Bowei, et al.
Pubblicazione: (2025)

Learning to Align Generative Appearance Priors for Fine-grained Image Retrieval
di: Wang, Shijie, et al.
Pubblicazione: (2026)

StyleTextGen: Style-Conditioned Multilingual Scene Text Generation
di: Chen, Zeyu, et al.
Pubblicazione: (2026)

TAMISeg: Text-Aligned Multi-scale Medical Image Segmentation with Semantic Encoder Distillation
di: Gao, Qiang, et al.
Pubblicazione: (2026)

EditRefiner: A Human-Aligned Agentic Framework for Image Editing Refinement
di: Xu, Zitong, et al.
Pubblicazione: (2026)

SeedEdit: Align Image Re-Generation to Image Editing
di: Shi, Yichun, et al.
Pubblicazione: (2024)

Asynchronous Denoising Diffusion Models for Aligning Text-to-Image Generation
di: Hu, Zijing, et al.
Pubblicazione: (2025)

Skill-Aligned Annotation for Reliable Evaluation in Text-to-Image Generation
di: Eldesokey, Abdelrahman, et al.
Pubblicazione: (2026)

UniTriGen: Unified Triplet Generation of Aligned Visible-Infrared-Label for Few-Shot RGB-T Semantic Segmentation
di: Zhou, Ping, et al.
Pubblicazione: (2026)

Style-NeRF2NeRF: 3D Style Transfer From Style-Aligned Multi-View Images
di: Fujiwara, Haruo, et al.
Pubblicazione: (2024)

Driving-Video Dehazing with Non-Aligned Regularization for Safety Assistance
di: Fan, Junkai, et al.
Pubblicazione: (2024)

Pixal3D: Pixel-Aligned 3D Generation from Images
di: Li, Dong-Yang, et al.
Pubblicazione: (2026)

PhaSR: Generalized Image Shadow Removal with Physically Aligned Priors
di: Lee, Chia-Ming, et al.
Pubblicazione: (2026)

SAQ-SAM: Semantically-Aligned Quantization for Segment Anything Model
di: Zhang, Jing, et al.
Pubblicazione: (2025)

Aligning Medical Images with General Knowledge from Large Language Models
di: Fang, Xiao, et al.
Pubblicazione: (2024)

AGHI-QA: A Subjective-Aligned Dataset and Metric for AI-Generated Human Images
di: Li, Yunhao, et al.
Pubblicazione: (2025)

Parallax to Align Them All: An OmniParallax Attention Mechanism for Distributed Multi-View Image Compression
di: Zhang, Haotian, et al.
Pubblicazione: (2026)

Align Beyond Prompts: Evaluating World Knowledge Alignment in Text-to-Image Generation
di: Zhang, Wenchao, et al.
Pubblicazione: (2025)

Align-DETR: Enhancing End-to-end Object Detection with Aligned Loss
di: Cai, Zhi, et al.
Pubblicazione: (2023)

Fusion in Your Way: Aligning Image Fusion with Heterogeneous Demands via Direct Preference Optimization
di: Su, Weijian, et al.
Pubblicazione: (2026)

Disentangle-then-Align: Non-Iterative Hybrid Multimodal Image Registration via Cross-Scale Feature Disentanglement
di: Zhang, Chunlei, et al.
Pubblicazione: (2026)

ChatGen: Automatic Text-to-Image Generation From FreeStyle Chatting
di: Jia, Chengyou, et al.
Pubblicazione: (2024)

Video-Bench: Human-Aligned Video Generation Benchmark
di: Han, Hui, et al.
Pubblicazione: (2025)

MIND-Edit: MLLM Insight-Driven Editing via Language-Vision Projection
di: Wang, Shuyu, et al.
Pubblicazione: (2025)