:: Library Catalog

Cover Image

Saved in:

Bibliographic Details
Main Authors:	Jung, Yunji, Lee, Seokju, Djanibekov, Tair, Shim, Hyunjung, Ye, Jong Chul
Format:	Preprint
Published:	2024
Subjects:	Computer Vision and Pattern Recognition
Online Access:	https://arxiv.org/abs/2402.08601
Tags:	Add Tag No Tags, Be the first to tag this record!

Similar Items

Adaptive Non-uniform Timestep Sampling for Accelerating Diffusion Model Training
by: Kim, Myunsoo, et al.
Published: (2024)

Scribble-Guided Diffusion for Training-free Text-to-Image Generation
by: Lee, Seonho, et al.
Published: (2024)

Precision matters: Precision-aware ensemble for weakly supervised semantic segmentation
by: Park, Junsung, et al.
Published: (2024)

Prompt the Unseen: Evaluating Visual-Language Alignment Beyond Supervision
by: Jung, Raehyuk, et al.
Published: (2025)

TV-LiVE: Training-Free, Text-Guided Video Editing via Layer Informed Vitality Exploitation
by: Kim, Min-Jung, et al.
Published: (2025)

Learning from Spatio-temporal Correlation for Semi-Supervised LiDAR Semantic Segmentation
by: Lee, Seungho, et al.
Published: (2024)

MaskRIS: Semantic Distortion-aware Data Augmentation for Referring Image Segmentation
by: Lee, Minhyun, et al.
Published: (2024)

Training-Free Reward-Guided Image Editing via Trajectory Optimal Control
by: Chang, Jinho, et al.
Published: (2025)

FlowAlign: Trajectory-Regularized, Inversion-Free Flow-based Image Editing
by: Kim, Jeongsol, et al.
Published: (2025)

Directional Textual Inversion for Personalized Text-to-Image Generation
by: Kim, Kunhee, et al.
Published: (2025)

Self-Supervised Vision Transformers Are Efficient Segmentation Learners for Imperfect Labels
by: Lee, Seungho, et al.
Published: (2024)

Sampling Bag of Views for Open-Vocabulary Object Detection
by: Choi, Hojun, et al.
Published: (2024)

SeiT++: Masked Token Modeling Improves Storage-efficient Training
by: Lee, Minhyun, et al.
Published: (2023)

PromptLoop: Plug-and-Play Prompt Refinement via Latent Feedback for Diffusion Model Alignment
by: Lee, Suhyeon, et al.
Published: (2025)

Early Timestep Zero-Shot Candidate Selection for Instruction-Guided Image Editing
by: Kim, Joowon, et al.
Published: (2025)

ED-NeRF: Efficient Text-Guided Editing of 3D Scene with Latent Space NeRF
by: Park, Jangho, et al.
Published: (2023)

Contrastive Denoising Score for Text-guided Latent Diffusion Image Editing
by: Nam, Hyelin, et al.
Published: (2023)

Classifier-guided CLIP Distillation for Unsupervised Multi-label Classification
by: Kim, Dongseob, et al.
Published: (2025)

Addressing Image Hallucination in Text-to-Image Generation through Factual Image Retrieval
by: Lim, Youngsun, et al.
Published: (2024)

Weakly Supervised Semantic Segmentation for Driving Scenes
by: Kim, Dongseob, et al.
Published: (2023)

Grounding Driving VLA via Inverse Kinematics
by: Park, Junsung, et al.
Published: (2026)

Understanding Multi-Granularity for Open-Vocabulary Part Segmentation
by: Choi, Jiho, et al.
Published: (2024)

Fine-Grained Image-Text Correspondence with Cost Aggregation for Open-Vocabulary Part Segmentation
by: Choi, Jiho, et al.
Published: (2025)

Patch-wise Graph Contrastive Learning for Image Translation
by: Jung, Chanyong, et al.
Published: (2023)

Object-aware Inversion and Reassembly for Image Editing
by: Yang, Zhen, et al.
Published: (2023)

DreamCatalyst: Fast and High-Quality 3D Editing via Controlling Editability and Identity Preservation
by: Kim, Jiwook, et al.
Published: (2024)

Ground-A-Score: Scaling Up the Score Distillation for Multi-Attribute Editing
by: Chang, Hangeol, et al.
Published: (2024)

Ground-A-Video: Zero-shot Grounded Video Editing using Text-to-image Diffusion Models
by: Jeong, Hyeonho, et al.
Published: (2023)

Unified Editing of Panorama, 3D Scenes, and Videos Through Disentangled Self-Attention Injection
by: Kwon, Gihyun, et al.
Published: (2024)

TextBoost: Boosting Text Encoder for Personalized Text-to-Image Generation
by: Park, NaHyeon, et al.
Published: (2024)

SGSoft: Learning Fused Semantic-Geometric Features for 3D Shape Correspondence via Template-Guided Soft Signals
by: Yoon, Soyeon, et al.
Published: (2026)

Latent Schrodinger Bridge: Prompting Latent Diffusion for Fast Unpaired Image-to-Image Translation
by: Kim, Jeongsol, et al.
Published: (2024)

FILT3R: Latent State Adaptive Kalman Filter for Streaming 3D Reconstruction
by: Jin, Seonghyun, et al.
Published: (2026)

No Thing, Nothing: Highlighting Safety-Critical Classes for Robust LiDAR Semantic Segmentation in Adverse Weather
by: Park, Junsung, et al.
Published: (2025)

Blind to Position, Biased in Language: Probing Mid-Layer Representational Bias in Vision-Language Encoders for Zero-Shot Language-Grounded Spatial Understanding
by: An, Na Min, et al.
Published: (2025)

VISION-XL: High Definition Video Inverse Problem Solver using Latent Image Diffusion Models
by: Kwon, Taesung, et al.
Published: (2024)

Zero4D: Training-Free 4D Video Generation From Single Video Using Off-the-Shelf Video Diffusion
by: Park, Jangho, et al.
Published: (2025)

Label-Augmented Dataset Distillation
by: Kang, Seoungyoon, et al.
Published: (2024)

Memory-Efficient Fine-Tuning for Quantized Diffusion Model
by: Ryu, Hyogon, et al.
Published: (2024)

Rethinking Data Augmentation for Robust LiDAR Semantic Segmentation in Adverse Weather
by: Park, Junsung, et al.
Published: (2024)