Enregistré dans:
| Auteurs principaux: | Shin, Yeonsang, Kim, Jihwan, Song, Yumin, Lee, Kyungseung, Chung, Hyunhee, Na, Taeyoung |
|---|---|
| Format: | Preprint |
| Publié: |
2025
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2505.00975 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
AGDC: Autoregressive Generation of Variable-Length Sequences with Joint Discrete and Continuous Spaces
par: Shin, Yeonsang, et autres
Publié: (2026)
par: Shin, Yeonsang, et autres
Publié: (2026)
TransText: Alpha-as-RGB Representation for Transparent Text Animation
par: Zhang, Fei, et autres
Publié: (2026)
par: Zhang, Fei, et autres
Publié: (2026)
Learning to Sample Effective and Diverse Prompts for Text-to-Image Generation
par: Yun, Taeyoung, et autres
Publié: (2025)
par: Yun, Taeyoung, et autres
Publié: (2025)
ILDiff: Generate Transparent Animated Stickers by Implicit Layout Distillation
par: Zhang, Ting, et autres
Publié: (2024)
par: Zhang, Ting, et autres
Publié: (2024)
FIFO-Diffusion: Generating Infinite Videos from Text without Training
par: Kim, Jihwan, et autres
Publié: (2024)
par: Kim, Jihwan, et autres
Publié: (2024)
Text-Animator: Controllable Visual Text Video Generation
par: Liu, Lin, et autres
Publié: (2024)
par: Liu, Lin, et autres
Publié: (2024)
Aggregated Structural Representation with Large Language Models for Human-Centric Layout Generation
par: Jin, Jiongchao, et autres
Publié: (2025)
par: Jin, Jiongchao, et autres
Publié: (2025)
Bidirectional Temporal Diffusion Model for Temporally Consistent Human Animation
par: Adiya, Tserendorj, et autres
Publié: (2023)
par: Adiya, Tserendorj, et autres
Publié: (2023)
SketchAnimator: Animate Sketch via Motion Customization of Text-to-Video Diffusion Models
par: Yang, Ruolin, et autres
Publié: (2025)
par: Yang, Ruolin, et autres
Publié: (2025)
TextBoost: Boosting Text Encoder for Personalized Text-to-Image Generation
par: Park, NaHyeon, et autres
Publié: (2024)
par: Park, NaHyeon, et autres
Publié: (2024)
HAMLET: Switch your Vision-Language-Action Model into a History-Aware Policy
par: Koo, Myungkyu, et autres
Publié: (2025)
par: Koo, Myungkyu, et autres
Publié: (2025)
Activating Self-Attention for Multi-Scene Absolute Pose Regression
par: Lee, Miso, et autres
Publié: (2024)
par: Lee, Miso, et autres
Publié: (2024)
Long-term Pre-training for Temporal Action Detection with Transformers
par: Kim, Jihwan, et autres
Publié: (2024)
par: Kim, Jihwan, et autres
Publié: (2024)
Advancing Text-Driven Chest X-Ray Generation with Policy-Based Reinforcement Learning
par: Han, Woojung, et autres
Publié: (2024)
par: Han, Woojung, et autres
Publié: (2024)
Geometry-Aware Representation Denoising for Robust Multi-view 3D Reconstruction
par: Kim, Jin Hyeon, et autres
Publié: (2026)
par: Kim, Jin Hyeon, et autres
Publié: (2026)
Layout-Conditioned Autoregressive Text-to-Image Generation via Structured Masking
par: Zheng, Zirui, et autres
Publié: (2025)
par: Zheng, Zirui, et autres
Publié: (2025)
When Cars Have Stereotypes: Auditing Demographic Bias in Objects from Text-to-Image Models
par: Choi, Dasol, et autres
Publié: (2025)
par: Choi, Dasol, et autres
Publié: (2025)
StructLayoutFormer:Conditional Structured Layout Generation via Structure Serialization and Disentanglement
par: Hu, Xin, et autres
Publié: (2025)
par: Hu, Xin, et autres
Publié: (2025)
Multitwine: Multi-Object Compositing with Text and Layout Control
par: Tarrés, Gemma Canet, et autres
Publié: (2025)
par: Tarrés, Gemma Canet, et autres
Publié: (2025)
Animate-X: Universal Character Image Animation with Enhanced Motion Representation
par: Tan, Shuai, et autres
Publié: (2024)
par: Tan, Shuai, et autres
Publié: (2024)
IM-Animation: An Implicit Motion Representation for Identity-decoupled Character Animation
par: Xu, Zhufeng, et autres
Publié: (2026)
par: Xu, Zhufeng, et autres
Publié: (2026)
Visual Diversity and Region-aware Prompt Learning for Zero-shot HOI Detection
par: Yang, Chanhyeong, et autres
Publié: (2025)
par: Yang, Chanhyeong, et autres
Publié: (2025)
Text-Aware Image Restoration with Diffusion Models
par: Min, Jaewon, et autres
Publié: (2025)
par: Min, Jaewon, et autres
Publié: (2025)
TableSeq: Unified Generation of Structure, Content, and Layout
par: Hamdi, Laziz, et autres
Publié: (2026)
par: Hamdi, Laziz, et autres
Publié: (2026)
LayoutFlow: Flow Matching for Layout Generation
par: Guerreiro, Julian Jorge Andrade, et autres
Publié: (2024)
par: Guerreiro, Julian Jorge Andrade, et autres
Publié: (2024)
Transferable Model-agnostic Vision-Language Model Adaptation for Efficient Weak-to-Strong Generalization
par: Park, Jihwan, et autres
Publié: (2025)
par: Park, Jihwan, et autres
Publié: (2025)
Super-class guided Transformer for Zero-Shot Attribute Classification
par: Kim, Sehyung, et autres
Publié: (2025)
par: Kim, Sehyung, et autres
Publié: (2025)
FlipSketch: Flipping Static Drawings to Text-Guided Sketch Animations
par: Bandyopadhyay, Hmrishav, et autres
Publié: (2024)
par: Bandyopadhyay, Hmrishav, et autres
Publié: (2024)
Enhancing Visual Re-ranking through Denoising Nearest Neighbor Graph via Continuous CRF
par: Kim, Jaeyoon, et autres
Publié: (2024)
par: Kim, Jaeyoon, et autres
Publié: (2024)
SciPostLayout: A Dataset for Layout Analysis and Layout Generation of Scientific Posters
par: Tanaka, Shohei, et autres
Publié: (2024)
par: Tanaka, Shohei, et autres
Publié: (2024)
LED Benchmark: Diagnosing Structural Layout Errors for Document Layout Analysis
par: Heo, Inbum, et autres
Publié: (2025)
par: Heo, Inbum, et autres
Publié: (2025)
IN2OUT: Fine-Tuning Video Inpainting Model for Video Outpainting Using Hierarchical Discriminator
par: Youn, Sangwoo, et autres
Publié: (2025)
par: Youn, Sangwoo, et autres
Publié: (2025)
AnimateAnything: Consistent and Controllable Animation for Video Generation
par: Lei, Guojun, et autres
Publié: (2024)
par: Lei, Guojun, et autres
Publié: (2024)
Visually Guided Generative Text-Layout Pre-training for Document Intelligence
par: Mao, Zhiming, et autres
Publié: (2024)
par: Mao, Zhiming, et autres
Publié: (2024)
MORPHOS: Autoregressive 4D Generation with Temporal Structured Latents
par: Kwon, Minkyung, et autres
Publié: (2026)
par: Kwon, Minkyung, et autres
Publié: (2026)
GALA: Generating Animatable Layered Assets from a Single Scan
par: Kim, Taeksoo, et autres
Publié: (2024)
par: Kim, Taeksoo, et autres
Publié: (2024)
TransAnimate: Taming Layer Diffusion to Generate RGBA Video
par: Chen, Xuewei, et autres
Publié: (2025)
par: Chen, Xuewei, et autres
Publié: (2025)
Hierarchically Structured Neural Bones for Reconstructing Animatable Objects from Casual Videos
par: Jeon, Subin, et autres
Publié: (2024)
par: Jeon, Subin, et autres
Publié: (2024)
Retrieval-Augmented Layout Transformer for Content-Aware Layout Generation
par: Horita, Daichi, et autres
Publié: (2023)
par: Horita, Daichi, et autres
Publié: (2023)
LayoutDiffusion: Controllable Diffusion Model for Layout-to-image Generation
par: Zheng, Guangcong, et autres
Publié: (2023)
par: Zheng, Guangcong, et autres
Publié: (2023)
Documents similaires
-
AGDC: Autoregressive Generation of Variable-Length Sequences with Joint Discrete and Continuous Spaces
par: Shin, Yeonsang, et autres
Publié: (2026) -
TransText: Alpha-as-RGB Representation for Transparent Text Animation
par: Zhang, Fei, et autres
Publié: (2026) -
Learning to Sample Effective and Diverse Prompts for Text-to-Image Generation
par: Yun, Taeyoung, et autres
Publié: (2025) -
ILDiff: Generate Transparent Animated Stickers by Implicit Layout Distillation
par: Zhang, Ting, et autres
Publié: (2024) -
FIFO-Diffusion: Generating Infinite Videos from Text without Training
par: Kim, Jihwan, et autres
Publié: (2024)