:: Library Catalog

Image de couverture de livre

Enregistré dans:

Détails bibliographiques
Auteurs principaux:	Lee, Hyunjong, Lee, Jangho, Lee, Jaekoo
Format:	Preprint
Publié:	2025
Sujets:	Computer Vision and Pattern Recognition
Accès en ligne:	https://arxiv.org/abs/2511.10385
Tags:	Ajouter un tag Pas de tags, Soyez le premier à ajouter un tag!

Documents similaires

Controllable 3D Object Generation with Single Image Prompt
par: Lee, Jaeseok, et autres
Publié: (2025)

Leveraging Text-Driven Semantic Variation for Robust OOD Segmentation
par: Song, Seungheon, et autres
Publié: (2025)

It's Time to Get It Right: Improving Analog Clock Reading and Clock-Hand Spatial Reasoning in Vision-Language Models
par: Choi, Jaeha, et autres
Publié: (2026)

FEAT: Fashion Editing and Try-On from Any Design
par: Kwon, Soye, et autres
Publié: (2026)

Learning Temporal Cues by Predicting Objects Move for Multi-camera 3D Object Detection
par: Moon, Seokha, et autres
Publié: (2024)

TempCore: Are Video QA Benchmarks Temporally Grounded? A Frame Selection Sensitivity Analysis and Benchmark
par: Ok, Hyunjong, et autres
Publié: (2025)

BEM: Training-Free Background Embedding Memory for False-Positive Suppression in Real-Time Fixed-Background Camera
par: Park, Junwoo, et autres
Publié: (2026)

Long-term Pre-training for Temporal Action Detection with Transformers
par: Kim, Jihwan, et autres
Publié: (2024)

GUIDE-CoT: Goal-driven and User-Informed Dynamic Estimation for Pedestrian Trajectory using Chain-of-Thought
par: Kim, Sungsik, et autres
Publié: (2025)

Understanding the Effects of Distractors on Reasoning Vision-Language Models
par: Bae, Jiyun, et autres
Publié: (2025)

Can MLLMs Reason About Visual Persuasion? Evaluating the Efficacy and Faithfulness of Reasoning
par: Lee, Naeun, et autres
Publié: (2026)

MutDet: Mutually Optimizing Pre-training for Remote Sensing Object Detection
par: Huang, Ziyue, et autres
Publié: (2024)

VisDoT : Enhancing Visual Reasoning through Human-Like Interpretation Grounding and Decomposition of Thought
par: Lee, Eunsoo, et autres
Publié: (2026)

Unsupervised Attention Regularization Based Domain Adaptation for Oracle Character Recognition
par: Wang, Mei, et autres
Publié: (2024)

Retaining and Enhancing Pre-trained Knowledge in Vision-Language Models with Prompt Ensembling
par: Kim, Donggeun, et autres
Publié: (2024)

Jointly Learning Spatial, Angular, and Temporal Information for Enhanced Lane Detection
par: Alam, Muhammad Zeshan
Publié: (2024)

Do Pre-trained Models Benefit Equally in Continual Learning?
par: Lee, Kuan-Ying, et autres
Publié: (2022)

DiffusionLane: Diffusion Model for Lane Detection
par: Zhou, Kunyang, et autres
Publié: (2025)

Stay in your Lane: Role Specific Queries with Overlap Suppression Loss for Dense Video Captioning
par: Baek, Seung Hyup, et autres
Publié: (2026)

Emerging Property of Masked Token for Effective Pre-training
par: Choi, Hyesong, et autres
Publié: (2024)

Clothing agnostic Pre-inpainting Virtual Try-ON
par: Kim, Sehyun, et autres
Publié: (2025)

Attention-based U-Net Method for Autonomous Lane Detection
par: Tangestanizadeh, Mohammadhamed, et autres
Publié: (2024)

Towards Privacy-preserved Pre-training of Remote Sensing Foundation Models with Federated Mutual-guidance Learning
par: Tan, Jieyi, et autres
Publié: (2025)

GFSR: Geometric Fidelity and Spatial Refinement for Reliable Lane Detection
par: Wang, Tiancheng, et autres
Publié: (2026)

PropFly: Learning to Propagate via On-the-Fly Supervision from Pre-trained Video Diffusion Models
par: Seo, Wonyong, et autres
Publié: (2026)

Lane-Keeping Control of Autonomous Vehicles Through a Soft-Constrained Iterative LQR
par: Lee, Der-Hau
Publié: (2023)

Guided Slot Attention for Unsupervised Video Object Segmentation
par: Lee, Minhyeok, et autres
Publié: (2023)

Selective Focus: Investigating Semantics Sensitivity in Post-training Quantization for Lane Detection
par: Fan, Yunqian, et autres
Publié: (2024)

CountSteer: Steering Attention for Object Counting in Diffusion Models
par: Boo, Hyemin, et autres
Publié: (2025)

LaneCorrect: Self-supervised Lane Detection
par: Nie, Ming, et autres
Publié: (2024)

LanePerf: a Performance Estimation Framework for Lane Detection
par: Wu, Yin, et autres
Publié: (2025)

Unified Editing of Panorama, 3D Scenes, and Videos Through Disentangled Self-Attention Injection
par: Kwon, Gihyun, et autres
Publié: (2024)

Transforming Static Images Using Generative Models for Video Salient Object Detection
par: Cho, Suhwan, et autres
Publié: (2024)

HD Maps are Lane Detection Generalizers: A Novel Generative Framework for Single-Source Domain Generalization
par: Lee, Daeun, et autres
Publié: (2023)

Universal Few-Shot Spatial Control for Diffusion Models
par: Nguyen, Kiet T., et autres
Publié: (2025)

Dual Prototype Attention for Unsupervised Video Object Segmentation
par: Cho, Suhwan, et autres
Publié: (2022)

Classification Matters: Improving Video Action Detection with Class-Specific Attention
par: Lee, Jinsung, et autres
Publié: (2024)

Attention Prompt Tuning: Parameter-efficient Adaptation of Pre-trained Models for Spatiotemporal Modeling
par: Bandara, Wele Gedara Chaminda, et autres
Publié: (2024)

CAST: Cross-Attention in Space and Time for Video Action Recognition
par: Lee, Dongho, et autres
Publié: (2023)

Integrating Query-aware Segmentation and Cross-Attention for Robust VQA
par: Choi, Wonjun, et autres
Publié: (2024)