:: Library Catalog

Image de couverture de livre

Enregistré dans:

Détails bibliographiques
Auteurs principaux:	Chen, Hongyu, Zhou, Min, Jiang, Jing, Chen, Jiale, Lu, Yang, Lin, Zihang, Xiao, Bo, Ge, Tiezheng, Zheng, Bo
Format:	Preprint
Publié:	2025
Sujets:	Computer Vision and Pattern Recognition
Accès en ligne:	https://arxiv.org/abs/2501.14316
Tags:	Ajouter un tag Pas de tags, Soyez le premier à ajouter un tag!

Documents similaires

PosterMaker: Towards High-Quality Product Poster Generation with Accurate Text Rendering
par: Gao, Yifan, et autres
Publié: (2025)

GAN-based Domain Adaptation for Image-aware Layout Generation in Advertising Poster Design
par: Xu, Chenchen, et autres
Publié: (2026)

Enhancing Prompt Following with Visual Control Through Training-Free Mask-Guided Diffusion
par: Chen, Hongyu, et autres
Publié: (2024)

Edit-GRPO: A Locality-Preserving Policy Optimization Framework for Image Editing
par: Xu, Shaodong, et autres
Publié: (2026)

Accelerating Image Generation with Sub-path Linear Approximation Model
par: Xu, Chen, et autres
Publié: (2024)

Rethinking Scribble-Guided Image Editing: Generalization, Instruction Adherence, and Multi-Tasking
par: Xu, Mingyi, et autres
Publié: (2026)

Identity-Preserving Image-to-Video Generation via Reward-Guided Optimization
par: Shen, Liao, et autres
Publié: (2025)

RHanDS: Refining Malformed Hands for Generated Images with Decoupled Structure and Style Guidance
par: Wang, Chengrui, et autres
Publié: (2024)

DreamPoster: A Unified Framework for Image-Conditioned Generative Poster Design
par: Hu, Xiwei, et autres
Publié: (2025)

AtomoVideo: High Fidelity Image-to-Video Generation
par: Gong, Litong, et autres
Publié: (2024)

Tuning-Free Noise Rectification for High Fidelity Image-to-Video Generation
par: Li, Weijie, et autres
Publié: (2024)

DDA-Thinker: Decoupled Dual-Atomic Reinforcement Learning for Reasoning-Driven Image Editing
par: Yang, Hanqing, et autres
Publié: (2026)

FlowDCN: Exploring DCN-like Architectures for Fast Image Generation with Arbitrary Resolution
par: Wang, Shuai, et autres
Publié: (2024)

DMM: Building a Versatile Image Generation Model via Distillation-Based Model Merging
par: Song, Tianhui, et autres
Publié: (2025)

VC4VG: Optimizing Video Captions for Text-to-Video Generation
par: Du, Yang, et autres
Publié: (2025)

CF-Font: Content Fusion for Few-shot Font Generation
par: Wang, Chi, et autres
Publié: (2023)

Unified Thinker: A General Reasoning Modular Core for Image Generation
par: Zhou, Sashuai, et autres
Publié: (2026)

SceneBooth: Diffusion-based Framework for Subject-preserved Text-to-Image Generation
par: Chai, Shang, et autres
Publié: (2025)

Beyond Visual Cues: Synchronously Exploring Target-Centric Semantics for Vision-Language Tracking
par: Ge, Jiawei, et autres
Publié: (2023)

GaussianIP: Identity-Preserving Realistic 3D Human Generation via Human-Centric Diffusion Prior
par: Tang, Zichen, et autres
Publié: (2025)

GRACE: Designing Generative Face Video Codec via Agile Hardware-Centric Workflow
par: Wan, Rui, et autres
Publié: (2025)

Differentiable Solver Search for Fast Diffusion Sampling
par: Wang, Shuai, et autres
Publié: (2025)

CTR-Driven Ad Text Generation via Online Feedback Preference Optimization
par: Chen, Yanda, et autres
Publié: (2025)

DAGLFNet: Deep Feature Attention Guided Global and Local Feature Fusion for Pseudo-Image Point Cloud Segmentation
par: Chen, Chuang, et autres
Publié: (2025)

PosterCraft: Rethinking High-Quality Aesthetic Poster Generation in a Unified Framework
par: Chen, SiXiang, et autres
Publié: (2025)

SARU: A Shadow-Aware and Removal Unified Framework for Remote Sensing Images with New Benchmarks
par: Bo, Zi-Yang, et autres
Publié: (2026)

Creative4U: MLLMs-based Advertising Creative Image Selector with Comparative Reasoning
par: Lin, Yukang, et autres
Publié: (2025)

Self-Supervised Contrastive Learning for Multi-Label Images
par: Chen, Jiale
Publié: (2025)

PRISM: Prior Rectification and Uncertainty-Aware Structure Modeling for Diffusion-Based Text Image Super-Resolution
par: Xu, Zihang, et autres
Publié: (2026)

Planning and Rendering: Towards Product Poster Generation with Diffusion Models
par: Li, Zhaochen, et autres
Publié: (2023)

QASA: Quality-Guided K-Adaptive Slot Attention for Unsupervised Object-Centric Learning
par: Ouyang, Tianran, et autres
Publié: (2026)

FideDiff: Efficient Diffusion Model for High-Fidelity Image Motion Deblurring
par: Liu, Xiaoyang, et autres
Publié: (2025)

NarrativeTrack: Evaluating Entity-Centric Reasoning for Narrative Understanding
par: Ha, Hyeonjeong, et autres
Publié: (2026)

TBStar-Edit: From Image Editing Pattern Shifting to Consistency Enhancement
par: Fang, Hao, et autres
Publié: (2025)

RHVI-FDD: A Hierarchical Decoupling Framework for Low-Light Image Enhancement
par: Yang, Junhao, et autres
Publié: (2026)

SkyReels-Text: Fine-Grained Font-Controllable Text Editing for Poster Design
par: Yu, Yunjie, et autres
Publié: (2025)

Strictly-ID-Preserved and Controllable Accessory Advertising Image Generation
par: Xue, Youze, et autres
Publié: (2024)

Scan Clusters, Not Pixels: A Cluster-Centric Paradigm for Efficient Ultra-high-definition Image Restoration
par: Wu, Chen, et autres
Publié: (2026)

PosterVerse: A Full-Workflow Framework for Commercial-Grade Poster Generation with HTML-Based Scalable Typography
par: Liu, Junle, et autres
Publié: (2026)

Multilingual Text-to-Image Person Retrieval via Bidirectional Relation Reasoning and Aligning
par: Cao, Min, et autres
Publié: (2025)