:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autori principali:	Park, Minho, Park, Sunghyun, Yun, Jooyeol, Choo, Jaegul
Natura:	Preprint
Pubblicazione:	2024
Soggetti:	Computer Vision and Pattern Recognition
Accesso online:	https://arxiv.org/abs/2406.05432
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

SphereDiff: Tuning-free 360° Static and Dynamic Panorama Generation via Spherical Latent Representation
di: Park, Minho, et al.
Pubblicazione: (2025)

Scaling Up Personalized Image Aesthetic Assessment via Task Vector Customization
di: Yun, Jooyeol, et al.
Pubblicazione: (2024)

Vector Prism: Animating Vector Graphics by Stratifying Semantic Structure
di: Yun, Jooyeol, et al.
Pubblicazione: (2025)

Devil is in the Detail: Towards Injecting Fine Details of Image Prompt in Image Generation via Conflict-free Guidance and Stratified Attention
di: Jo, Kyungmin, et al.
Pubblicazione: (2025)

CA-LoRA: Concept-Aware LoRA for Domain-Aligned Segmentation Dataset Generation
di: Park, Minho, et al.
Pubblicazione: (2025)

What to Preserve and What to Transfer: Faithful, Identity-Preserving Diffusion-based Hairstyle Transfer
di: Chung, Chaeyeon, et al.
Pubblicazione: (2024)

Enabling Region-Specific Control via Lassos in Point-Based Colorization
di: Lee, Sanghyeon, et al.
Pubblicazione: (2024)

From Wardrobe to Canvas: Wardrobe Polyptych LoRA for Part-level Controllable Human Image Generation
di: Kim, Jeongho, et al.
Pubblicazione: (2025)

PromptDresser: Improving the Quality and Controllability of Virtual Try-On via Generative Textual Prompt and Prompt-aware Mask
di: Kim, Jeongho, et al.
Pubblicazione: (2024)

Imagining the Unseen: Generative Location Modeling for Object Placement
di: Yun, Jooyeol, et al.
Pubblicazione: (2024)

Cross-Frame Representation Alignment for Fine-Tuning Video Diffusion Models
di: Hwang, Sungwon, et al.
Pubblicazione: (2025)

DesignLab: Designing Slides Through Iterative Detection and Correction
di: Yun, Jooyeol, et al.
Pubblicazione: (2025)

EgoX: Egocentric Video Generation from a Single Exocentric Video
di: Kang, Taewoong, et al.
Pubblicazione: (2025)

Memory-Efficient Fine-Tuning Diffusion Transformers via Dynamic Patch Sampling and Block Skipping
di: Park, Sunghyun, et al.
Pubblicazione: (2026)

Training Spatial-Frequency Visual Prompts and Probabilistic Clusters for Accurate Black-Box Transfer Learning
di: Cho, Wonwoo, et al.
Pubblicazione: (2024)

Skip-and-Play: Depth-Driven Pose-Preserved Image Generation for Any Objects
di: Jo, Kyungmin, et al.
Pubblicazione: (2024)

Enhancing Intrinsic Features for Debiasing via Investigating Class-Discerning Common Attributes in Bias-Contrastive Pair
di: Park, Jeonghoon, et al.
Pubblicazione: (2024)

TV-LiVE: Training-Free, Text-Guided Video Editing via Layer Informed Vitality Exploitation
di: Kim, Min-Jung, et al.
Pubblicazione: (2025)

Investigating Pre-Training Objectives for Generalization in Vision-Based Reinforcement Learning
di: Kim, Donghu, et al.
Pubblicazione: (2024)

Steering Guidance for Personalized Text-to-Image Diffusion Models
di: Park, Sunghyun, et al.
Pubblicazione: (2025)

Learning to See What You Need: Gaze Attention for Multimodal Large Language Models
di: Song, Junha, et al.
Pubblicazione: (2026)

Temporal In-Context Fine-Tuning with Temporal Reasoning for Versatile Control of Video Diffusion Models
di: Kim, Kinam, et al.
Pubblicazione: (2025)

Fair Generation without Unfair Distortions: Debiasing Text-to-Image Generation with Entanglement-Free Attention
di: Park, Jeonghoon, et al.
Pubblicazione: (2025)

ConceptScope: Characterizing Dataset Bias via Disentangled Visual Concepts
di: Choi, Jinho, et al.
Pubblicazione: (2025)

Memory-Efficient Personalization of Text-to-Image Diffusion Models via Selective Optimization Strategies
di: Choi, Seokeon, et al.
Pubblicazione: (2025)

GaussianMotion: End-to-End Learning of Animatable Gaussian Avatars with Pose Guidance from Text
di: Shim, Gyumin, et al.
Pubblicazione: (2025)

Towards Calibrated Robust Fine-Tuning of Vision-Language Models
di: Oh, Changdae, et al.
Pubblicazione: (2023)

Effective Rank Analysis and Regularization for Enhanced 3D Gaussian Splatting
di: Hyung, Junha, et al.
Pubblicazione: (2024)

Good Noise Makes Good Edits: A Training-Free Diffusion-Based Video Editing with Image and Text Prompts
di: Choi, Saemee, et al.
Pubblicazione: (2025)

Bones Can't Be Triangles: Accurate and Efficient Vertebrae Keypoint Estimation through Collaborative Error Revision
di: Kim, Jinhee, et al.
Pubblicazione: (2024)

Zero-Shot Head Swapping in Real-World Scenarios
di: Kang, Taewoong, et al.
Pubblicazione: (2025)

RL makes MLLMs see better than SFT
di: Song, Junha, et al.
Pubblicazione: (2025)

Leveraging Learned Image Prior for 3D Gaussian Compression
di: Shin, Seungjoo, et al.
Pubblicazione: (2025)

Locality-aware Gaussian Compression for Fast and High-quality Rendering
di: Shin, Seungjoo, et al.
Pubblicazione: (2025)

Diffusion Model Compression for Image-to-Image Translation
di: Kim, Geonung, et al.
Pubblicazione: (2024)

Infinite-Homography as Robust Conditioning for Camera-Controlled Video Generation
di: Kim, Min-Jung, et al.
Pubblicazione: (2025)

MagiCapture: High-Resolution Multi-Concept Portrait Customization
di: Hyung, Junha, et al.
Pubblicazione: (2023)

Evaluating Visual and Cultural Interpretation: The K-Viscuit Benchmark with Human-VLM Collaboration
di: Park, ChaeHun, et al.
Pubblicazione: (2024)

Emergence of Text Readability in Vision Language Models
di: Park, Jaeyoo, et al.
Pubblicazione: (2025)

OPRO: Orthogonal Panel-Relative Operators for Panel-Aware In-Context Image Generation
di: Lee, Sanghyeon, et al.
Pubblicazione: (2026)