:: Library Catalog

Image de couverture de livre

Enregistré dans:

Détails bibliographiques
Auteurs principaux:	Shin, Yeonsang, Kim, Jihwan, Song, Yumin, Lee, Kyungseung, Chung, Hyunhee, Na, Taeyoung
Format:	Preprint
Publié:	2025
Sujets:	Computer Vision and Pattern Recognition
Accès en ligne:	https://arxiv.org/abs/2505.00975
Tags:	Ajouter un tag Pas de tags, Soyez le premier à ajouter un tag!

Documents similaires

AGDC: Autoregressive Generation of Variable-Length Sequences with Joint Discrete and Continuous Spaces
par: Shin, Yeonsang, et autres
Publié: (2026)

TransText: Alpha-as-RGB Representation for Transparent Text Animation
par: Zhang, Fei, et autres
Publié: (2026)

Learning to Sample Effective and Diverse Prompts for Text-to-Image Generation
par: Yun, Taeyoung, et autres
Publié: (2025)

ILDiff: Generate Transparent Animated Stickers by Implicit Layout Distillation
par: Zhang, Ting, et autres
Publié: (2024)

FIFO-Diffusion: Generating Infinite Videos from Text without Training
par: Kim, Jihwan, et autres
Publié: (2024)

Text-Animator: Controllable Visual Text Video Generation
par: Liu, Lin, et autres
Publié: (2024)

Aggregated Structural Representation with Large Language Models for Human-Centric Layout Generation
par: Jin, Jiongchao, et autres
Publié: (2025)

Bidirectional Temporal Diffusion Model for Temporally Consistent Human Animation
par: Adiya, Tserendorj, et autres
Publié: (2023)

SketchAnimator: Animate Sketch via Motion Customization of Text-to-Video Diffusion Models
par: Yang, Ruolin, et autres
Publié: (2025)

TextBoost: Boosting Text Encoder for Personalized Text-to-Image Generation
par: Park, NaHyeon, et autres
Publié: (2024)

HAMLET: Switch your Vision-Language-Action Model into a History-Aware Policy
par: Koo, Myungkyu, et autres
Publié: (2025)

Activating Self-Attention for Multi-Scene Absolute Pose Regression
par: Lee, Miso, et autres
Publié: (2024)

Long-term Pre-training for Temporal Action Detection with Transformers
par: Kim, Jihwan, et autres
Publié: (2024)

Advancing Text-Driven Chest X-Ray Generation with Policy-Based Reinforcement Learning
par: Han, Woojung, et autres
Publié: (2024)

Geometry-Aware Representation Denoising for Robust Multi-view 3D Reconstruction
par: Kim, Jin Hyeon, et autres
Publié: (2026)

Layout-Conditioned Autoregressive Text-to-Image Generation via Structured Masking
par: Zheng, Zirui, et autres
Publié: (2025)

When Cars Have Stereotypes: Auditing Demographic Bias in Objects from Text-to-Image Models
par: Choi, Dasol, et autres
Publié: (2025)

StructLayoutFormer:Conditional Structured Layout Generation via Structure Serialization and Disentanglement
par: Hu, Xin, et autres
Publié: (2025)

Multitwine: Multi-Object Compositing with Text and Layout Control
par: Tarrés, Gemma Canet, et autres
Publié: (2025)

Animate-X: Universal Character Image Animation with Enhanced Motion Representation
par: Tan, Shuai, et autres
Publié: (2024)

IM-Animation: An Implicit Motion Representation for Identity-decoupled Character Animation
par: Xu, Zhufeng, et autres
Publié: (2026)

Visual Diversity and Region-aware Prompt Learning for Zero-shot HOI Detection
par: Yang, Chanhyeong, et autres
Publié: (2025)

Text-Aware Image Restoration with Diffusion Models
par: Min, Jaewon, et autres
Publié: (2025)

TableSeq: Unified Generation of Structure, Content, and Layout
par: Hamdi, Laziz, et autres
Publié: (2026)

LayoutFlow: Flow Matching for Layout Generation
par: Guerreiro, Julian Jorge Andrade, et autres
Publié: (2024)

Transferable Model-agnostic Vision-Language Model Adaptation for Efficient Weak-to-Strong Generalization
par: Park, Jihwan, et autres
Publié: (2025)

Super-class guided Transformer for Zero-Shot Attribute Classification
par: Kim, Sehyung, et autres
Publié: (2025)

FlipSketch: Flipping Static Drawings to Text-Guided Sketch Animations
par: Bandyopadhyay, Hmrishav, et autres
Publié: (2024)

Enhancing Visual Re-ranking through Denoising Nearest Neighbor Graph via Continuous CRF
par: Kim, Jaeyoon, et autres
Publié: (2024)

SciPostLayout: A Dataset for Layout Analysis and Layout Generation of Scientific Posters
par: Tanaka, Shohei, et autres
Publié: (2024)

LED Benchmark: Diagnosing Structural Layout Errors for Document Layout Analysis
par: Heo, Inbum, et autres
Publié: (2025)

IN2OUT: Fine-Tuning Video Inpainting Model for Video Outpainting Using Hierarchical Discriminator
par: Youn, Sangwoo, et autres
Publié: (2025)

AnimateAnything: Consistent and Controllable Animation for Video Generation
par: Lei, Guojun, et autres
Publié: (2024)

Visually Guided Generative Text-Layout Pre-training for Document Intelligence
par: Mao, Zhiming, et autres
Publié: (2024)

MORPHOS: Autoregressive 4D Generation with Temporal Structured Latents
par: Kwon, Minkyung, et autres
Publié: (2026)

GALA: Generating Animatable Layered Assets from a Single Scan
par: Kim, Taeksoo, et autres
Publié: (2024)

TransAnimate: Taming Layer Diffusion to Generate RGBA Video
par: Chen, Xuewei, et autres
Publié: (2025)

Hierarchically Structured Neural Bones for Reconstructing Animatable Objects from Casual Videos
par: Jeon, Subin, et autres
Publié: (2024)

Retrieval-Augmented Layout Transformer for Content-Aware Layout Generation
par: Horita, Daichi, et autres
Publié: (2023)

LayoutDiffusion: Controllable Diffusion Model for Layout-to-image Generation
par: Zheng, Guangcong, et autres
Publié: (2023)