Salvato in:
| Autori principali: | Park, Minho, Park, Sunghyun, Yun, Jooyeol, Choo, Jaegul |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2024
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2406.05432 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
SphereDiff: Tuning-free 360° Static and Dynamic Panorama Generation via Spherical Latent Representation
di: Park, Minho, et al.
Pubblicazione: (2025)
di: Park, Minho, et al.
Pubblicazione: (2025)
Scaling Up Personalized Image Aesthetic Assessment via Task Vector Customization
di: Yun, Jooyeol, et al.
Pubblicazione: (2024)
di: Yun, Jooyeol, et al.
Pubblicazione: (2024)
Vector Prism: Animating Vector Graphics by Stratifying Semantic Structure
di: Yun, Jooyeol, et al.
Pubblicazione: (2025)
di: Yun, Jooyeol, et al.
Pubblicazione: (2025)
Devil is in the Detail: Towards Injecting Fine Details of Image Prompt in Image Generation via Conflict-free Guidance and Stratified Attention
di: Jo, Kyungmin, et al.
Pubblicazione: (2025)
di: Jo, Kyungmin, et al.
Pubblicazione: (2025)
CA-LoRA: Concept-Aware LoRA for Domain-Aligned Segmentation Dataset Generation
di: Park, Minho, et al.
Pubblicazione: (2025)
di: Park, Minho, et al.
Pubblicazione: (2025)
What to Preserve and What to Transfer: Faithful, Identity-Preserving Diffusion-based Hairstyle Transfer
di: Chung, Chaeyeon, et al.
Pubblicazione: (2024)
di: Chung, Chaeyeon, et al.
Pubblicazione: (2024)
Enabling Region-Specific Control via Lassos in Point-Based Colorization
di: Lee, Sanghyeon, et al.
Pubblicazione: (2024)
di: Lee, Sanghyeon, et al.
Pubblicazione: (2024)
From Wardrobe to Canvas: Wardrobe Polyptych LoRA for Part-level Controllable Human Image Generation
di: Kim, Jeongho, et al.
Pubblicazione: (2025)
di: Kim, Jeongho, et al.
Pubblicazione: (2025)
PromptDresser: Improving the Quality and Controllability of Virtual Try-On via Generative Textual Prompt and Prompt-aware Mask
di: Kim, Jeongho, et al.
Pubblicazione: (2024)
di: Kim, Jeongho, et al.
Pubblicazione: (2024)
Imagining the Unseen: Generative Location Modeling for Object Placement
di: Yun, Jooyeol, et al.
Pubblicazione: (2024)
di: Yun, Jooyeol, et al.
Pubblicazione: (2024)
Cross-Frame Representation Alignment for Fine-Tuning Video Diffusion Models
di: Hwang, Sungwon, et al.
Pubblicazione: (2025)
di: Hwang, Sungwon, et al.
Pubblicazione: (2025)
DesignLab: Designing Slides Through Iterative Detection and Correction
di: Yun, Jooyeol, et al.
Pubblicazione: (2025)
di: Yun, Jooyeol, et al.
Pubblicazione: (2025)
EgoX: Egocentric Video Generation from a Single Exocentric Video
di: Kang, Taewoong, et al.
Pubblicazione: (2025)
di: Kang, Taewoong, et al.
Pubblicazione: (2025)
Memory-Efficient Fine-Tuning Diffusion Transformers via Dynamic Patch Sampling and Block Skipping
di: Park, Sunghyun, et al.
Pubblicazione: (2026)
di: Park, Sunghyun, et al.
Pubblicazione: (2026)
Training Spatial-Frequency Visual Prompts and Probabilistic Clusters for Accurate Black-Box Transfer Learning
di: Cho, Wonwoo, et al.
Pubblicazione: (2024)
di: Cho, Wonwoo, et al.
Pubblicazione: (2024)
Skip-and-Play: Depth-Driven Pose-Preserved Image Generation for Any Objects
di: Jo, Kyungmin, et al.
Pubblicazione: (2024)
di: Jo, Kyungmin, et al.
Pubblicazione: (2024)
Enhancing Intrinsic Features for Debiasing via Investigating Class-Discerning Common Attributes in Bias-Contrastive Pair
di: Park, Jeonghoon, et al.
Pubblicazione: (2024)
di: Park, Jeonghoon, et al.
Pubblicazione: (2024)
TV-LiVE: Training-Free, Text-Guided Video Editing via Layer Informed Vitality Exploitation
di: Kim, Min-Jung, et al.
Pubblicazione: (2025)
di: Kim, Min-Jung, et al.
Pubblicazione: (2025)
Investigating Pre-Training Objectives for Generalization in Vision-Based Reinforcement Learning
di: Kim, Donghu, et al.
Pubblicazione: (2024)
di: Kim, Donghu, et al.
Pubblicazione: (2024)
Steering Guidance for Personalized Text-to-Image Diffusion Models
di: Park, Sunghyun, et al.
Pubblicazione: (2025)
di: Park, Sunghyun, et al.
Pubblicazione: (2025)
Learning to See What You Need: Gaze Attention for Multimodal Large Language Models
di: Song, Junha, et al.
Pubblicazione: (2026)
di: Song, Junha, et al.
Pubblicazione: (2026)
Temporal In-Context Fine-Tuning with Temporal Reasoning for Versatile Control of Video Diffusion Models
di: Kim, Kinam, et al.
Pubblicazione: (2025)
di: Kim, Kinam, et al.
Pubblicazione: (2025)
Fair Generation without Unfair Distortions: Debiasing Text-to-Image Generation with Entanglement-Free Attention
di: Park, Jeonghoon, et al.
Pubblicazione: (2025)
di: Park, Jeonghoon, et al.
Pubblicazione: (2025)
ConceptScope: Characterizing Dataset Bias via Disentangled Visual Concepts
di: Choi, Jinho, et al.
Pubblicazione: (2025)
di: Choi, Jinho, et al.
Pubblicazione: (2025)
Memory-Efficient Personalization of Text-to-Image Diffusion Models via Selective Optimization Strategies
di: Choi, Seokeon, et al.
Pubblicazione: (2025)
di: Choi, Seokeon, et al.
Pubblicazione: (2025)
GaussianMotion: End-to-End Learning of Animatable Gaussian Avatars with Pose Guidance from Text
di: Shim, Gyumin, et al.
Pubblicazione: (2025)
di: Shim, Gyumin, et al.
Pubblicazione: (2025)
Towards Calibrated Robust Fine-Tuning of Vision-Language Models
di: Oh, Changdae, et al.
Pubblicazione: (2023)
di: Oh, Changdae, et al.
Pubblicazione: (2023)
Effective Rank Analysis and Regularization for Enhanced 3D Gaussian Splatting
di: Hyung, Junha, et al.
Pubblicazione: (2024)
di: Hyung, Junha, et al.
Pubblicazione: (2024)
Good Noise Makes Good Edits: A Training-Free Diffusion-Based Video Editing with Image and Text Prompts
di: Choi, Saemee, et al.
Pubblicazione: (2025)
di: Choi, Saemee, et al.
Pubblicazione: (2025)
Bones Can't Be Triangles: Accurate and Efficient Vertebrae Keypoint Estimation through Collaborative Error Revision
di: Kim, Jinhee, et al.
Pubblicazione: (2024)
di: Kim, Jinhee, et al.
Pubblicazione: (2024)
Zero-Shot Head Swapping in Real-World Scenarios
di: Kang, Taewoong, et al.
Pubblicazione: (2025)
di: Kang, Taewoong, et al.
Pubblicazione: (2025)
RL makes MLLMs see better than SFT
di: Song, Junha, et al.
Pubblicazione: (2025)
di: Song, Junha, et al.
Pubblicazione: (2025)
Leveraging Learned Image Prior for 3D Gaussian Compression
di: Shin, Seungjoo, et al.
Pubblicazione: (2025)
di: Shin, Seungjoo, et al.
Pubblicazione: (2025)
Locality-aware Gaussian Compression for Fast and High-quality Rendering
di: Shin, Seungjoo, et al.
Pubblicazione: (2025)
di: Shin, Seungjoo, et al.
Pubblicazione: (2025)
Diffusion Model Compression for Image-to-Image Translation
di: Kim, Geonung, et al.
Pubblicazione: (2024)
di: Kim, Geonung, et al.
Pubblicazione: (2024)
Infinite-Homography as Robust Conditioning for Camera-Controlled Video Generation
di: Kim, Min-Jung, et al.
Pubblicazione: (2025)
di: Kim, Min-Jung, et al.
Pubblicazione: (2025)
MagiCapture: High-Resolution Multi-Concept Portrait Customization
di: Hyung, Junha, et al.
Pubblicazione: (2023)
di: Hyung, Junha, et al.
Pubblicazione: (2023)
Evaluating Visual and Cultural Interpretation: The K-Viscuit Benchmark with Human-VLM Collaboration
di: Park, ChaeHun, et al.
Pubblicazione: (2024)
di: Park, ChaeHun, et al.
Pubblicazione: (2024)
Emergence of Text Readability in Vision Language Models
di: Park, Jaeyoo, et al.
Pubblicazione: (2025)
di: Park, Jaeyoo, et al.
Pubblicazione: (2025)
OPRO: Orthogonal Panel-Relative Operators for Panel-Aware In-Context Image Generation
di: Lee, Sanghyeon, et al.
Pubblicazione: (2026)
di: Lee, Sanghyeon, et al.
Pubblicazione: (2026)
Documenti analoghi
-
SphereDiff: Tuning-free 360° Static and Dynamic Panorama Generation via Spherical Latent Representation
di: Park, Minho, et al.
Pubblicazione: (2025) -
Scaling Up Personalized Image Aesthetic Assessment via Task Vector Customization
di: Yun, Jooyeol, et al.
Pubblicazione: (2024) -
Vector Prism: Animating Vector Graphics by Stratifying Semantic Structure
di: Yun, Jooyeol, et al.
Pubblicazione: (2025) -
Devil is in the Detail: Towards Injecting Fine Details of Image Prompt in Image Generation via Conflict-free Guidance and Stratified Attention
di: Jo, Kyungmin, et al.
Pubblicazione: (2025) -
CA-LoRA: Concept-Aware LoRA for Domain-Aligned Segmentation Dataset Generation
di: Park, Minho, et al.
Pubblicazione: (2025)