Enregistré dans:
| Auteurs principaux: | Chen, Hongyu, Zhou, Min, Jiang, Jing, Chen, Jiale, Lu, Yang, Lin, Zihang, Xiao, Bo, Ge, Tiezheng, Zheng, Bo |
|---|---|
| Format: | Preprint |
| Publié: |
2025
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2501.14316 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
PosterMaker: Towards High-Quality Product Poster Generation with Accurate Text Rendering
par: Gao, Yifan, et autres
Publié: (2025)
par: Gao, Yifan, et autres
Publié: (2025)
GAN-based Domain Adaptation for Image-aware Layout Generation in Advertising Poster Design
par: Xu, Chenchen, et autres
Publié: (2026)
par: Xu, Chenchen, et autres
Publié: (2026)
Enhancing Prompt Following with Visual Control Through Training-Free Mask-Guided Diffusion
par: Chen, Hongyu, et autres
Publié: (2024)
par: Chen, Hongyu, et autres
Publié: (2024)
Edit-GRPO: A Locality-Preserving Policy Optimization Framework for Image Editing
par: Xu, Shaodong, et autres
Publié: (2026)
par: Xu, Shaodong, et autres
Publié: (2026)
Accelerating Image Generation with Sub-path Linear Approximation Model
par: Xu, Chen, et autres
Publié: (2024)
par: Xu, Chen, et autres
Publié: (2024)
Rethinking Scribble-Guided Image Editing: Generalization, Instruction Adherence, and Multi-Tasking
par: Xu, Mingyi, et autres
Publié: (2026)
par: Xu, Mingyi, et autres
Publié: (2026)
Identity-Preserving Image-to-Video Generation via Reward-Guided Optimization
par: Shen, Liao, et autres
Publié: (2025)
par: Shen, Liao, et autres
Publié: (2025)
RHanDS: Refining Malformed Hands for Generated Images with Decoupled Structure and Style Guidance
par: Wang, Chengrui, et autres
Publié: (2024)
par: Wang, Chengrui, et autres
Publié: (2024)
DreamPoster: A Unified Framework for Image-Conditioned Generative Poster Design
par: Hu, Xiwei, et autres
Publié: (2025)
par: Hu, Xiwei, et autres
Publié: (2025)
AtomoVideo: High Fidelity Image-to-Video Generation
par: Gong, Litong, et autres
Publié: (2024)
par: Gong, Litong, et autres
Publié: (2024)
Tuning-Free Noise Rectification for High Fidelity Image-to-Video Generation
par: Li, Weijie, et autres
Publié: (2024)
par: Li, Weijie, et autres
Publié: (2024)
DDA-Thinker: Decoupled Dual-Atomic Reinforcement Learning for Reasoning-Driven Image Editing
par: Yang, Hanqing, et autres
Publié: (2026)
par: Yang, Hanqing, et autres
Publié: (2026)
FlowDCN: Exploring DCN-like Architectures for Fast Image Generation with Arbitrary Resolution
par: Wang, Shuai, et autres
Publié: (2024)
par: Wang, Shuai, et autres
Publié: (2024)
DMM: Building a Versatile Image Generation Model via Distillation-Based Model Merging
par: Song, Tianhui, et autres
Publié: (2025)
par: Song, Tianhui, et autres
Publié: (2025)
VC4VG: Optimizing Video Captions for Text-to-Video Generation
par: Du, Yang, et autres
Publié: (2025)
par: Du, Yang, et autres
Publié: (2025)
CF-Font: Content Fusion for Few-shot Font Generation
par: Wang, Chi, et autres
Publié: (2023)
par: Wang, Chi, et autres
Publié: (2023)
Unified Thinker: A General Reasoning Modular Core for Image Generation
par: Zhou, Sashuai, et autres
Publié: (2026)
par: Zhou, Sashuai, et autres
Publié: (2026)
SceneBooth: Diffusion-based Framework for Subject-preserved Text-to-Image Generation
par: Chai, Shang, et autres
Publié: (2025)
par: Chai, Shang, et autres
Publié: (2025)
Beyond Visual Cues: Synchronously Exploring Target-Centric Semantics for Vision-Language Tracking
par: Ge, Jiawei, et autres
Publié: (2023)
par: Ge, Jiawei, et autres
Publié: (2023)
GaussianIP: Identity-Preserving Realistic 3D Human Generation via Human-Centric Diffusion Prior
par: Tang, Zichen, et autres
Publié: (2025)
par: Tang, Zichen, et autres
Publié: (2025)
GRACE: Designing Generative Face Video Codec via Agile Hardware-Centric Workflow
par: Wan, Rui, et autres
Publié: (2025)
par: Wan, Rui, et autres
Publié: (2025)
Differentiable Solver Search for Fast Diffusion Sampling
par: Wang, Shuai, et autres
Publié: (2025)
par: Wang, Shuai, et autres
Publié: (2025)
CTR-Driven Ad Text Generation via Online Feedback Preference Optimization
par: Chen, Yanda, et autres
Publié: (2025)
par: Chen, Yanda, et autres
Publié: (2025)
DAGLFNet: Deep Feature Attention Guided Global and Local Feature Fusion for Pseudo-Image Point Cloud Segmentation
par: Chen, Chuang, et autres
Publié: (2025)
par: Chen, Chuang, et autres
Publié: (2025)
PosterCraft: Rethinking High-Quality Aesthetic Poster Generation in a Unified Framework
par: Chen, SiXiang, et autres
Publié: (2025)
par: Chen, SiXiang, et autres
Publié: (2025)
SARU: A Shadow-Aware and Removal Unified Framework for Remote Sensing Images with New Benchmarks
par: Bo, Zi-Yang, et autres
Publié: (2026)
par: Bo, Zi-Yang, et autres
Publié: (2026)
Creative4U: MLLMs-based Advertising Creative Image Selector with Comparative Reasoning
par: Lin, Yukang, et autres
Publié: (2025)
par: Lin, Yukang, et autres
Publié: (2025)
Self-Supervised Contrastive Learning for Multi-Label Images
par: Chen, Jiale
Publié: (2025)
par: Chen, Jiale
Publié: (2025)
PRISM: Prior Rectification and Uncertainty-Aware Structure Modeling for Diffusion-Based Text Image Super-Resolution
par: Xu, Zihang, et autres
Publié: (2026)
par: Xu, Zihang, et autres
Publié: (2026)
Planning and Rendering: Towards Product Poster Generation with Diffusion Models
par: Li, Zhaochen, et autres
Publié: (2023)
par: Li, Zhaochen, et autres
Publié: (2023)
QASA: Quality-Guided K-Adaptive Slot Attention for Unsupervised Object-Centric Learning
par: Ouyang, Tianran, et autres
Publié: (2026)
par: Ouyang, Tianran, et autres
Publié: (2026)
FideDiff: Efficient Diffusion Model for High-Fidelity Image Motion Deblurring
par: Liu, Xiaoyang, et autres
Publié: (2025)
par: Liu, Xiaoyang, et autres
Publié: (2025)
NarrativeTrack: Evaluating Entity-Centric Reasoning for Narrative Understanding
par: Ha, Hyeonjeong, et autres
Publié: (2026)
par: Ha, Hyeonjeong, et autres
Publié: (2026)
TBStar-Edit: From Image Editing Pattern Shifting to Consistency Enhancement
par: Fang, Hao, et autres
Publié: (2025)
par: Fang, Hao, et autres
Publié: (2025)
RHVI-FDD: A Hierarchical Decoupling Framework for Low-Light Image Enhancement
par: Yang, Junhao, et autres
Publié: (2026)
par: Yang, Junhao, et autres
Publié: (2026)
SkyReels-Text: Fine-Grained Font-Controllable Text Editing for Poster Design
par: Yu, Yunjie, et autres
Publié: (2025)
par: Yu, Yunjie, et autres
Publié: (2025)
Strictly-ID-Preserved and Controllable Accessory Advertising Image Generation
par: Xue, Youze, et autres
Publié: (2024)
par: Xue, Youze, et autres
Publié: (2024)
Scan Clusters, Not Pixels: A Cluster-Centric Paradigm for Efficient Ultra-high-definition Image Restoration
par: Wu, Chen, et autres
Publié: (2026)
par: Wu, Chen, et autres
Publié: (2026)
PosterVerse: A Full-Workflow Framework for Commercial-Grade Poster Generation with HTML-Based Scalable Typography
par: Liu, Junle, et autres
Publié: (2026)
par: Liu, Junle, et autres
Publié: (2026)
Multilingual Text-to-Image Person Retrieval via Bidirectional Relation Reasoning and Aligning
par: Cao, Min, et autres
Publié: (2025)
par: Cao, Min, et autres
Publié: (2025)
Documents similaires
-
PosterMaker: Towards High-Quality Product Poster Generation with Accurate Text Rendering
par: Gao, Yifan, et autres
Publié: (2025) -
GAN-based Domain Adaptation for Image-aware Layout Generation in Advertising Poster Design
par: Xu, Chenchen, et autres
Publié: (2026) -
Enhancing Prompt Following with Visual Control Through Training-Free Mask-Guided Diffusion
par: Chen, Hongyu, et autres
Publié: (2024) -
Edit-GRPO: A Locality-Preserving Policy Optimization Framework for Image Editing
par: Xu, Shaodong, et autres
Publié: (2026) -
Accelerating Image Generation with Sub-path Linear Approximation Model
par: Xu, Chen, et autres
Publié: (2024)