Enregistré dans:
| Auteurs principaux: | Lee, Hyunjong, Lee, Jangho, Lee, Jaekoo |
|---|---|
| Format: | Preprint |
| Publié: |
2025
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2511.10385 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
Controllable 3D Object Generation with Single Image Prompt
par: Lee, Jaeseok, et autres
Publié: (2025)
par: Lee, Jaeseok, et autres
Publié: (2025)
Leveraging Text-Driven Semantic Variation for Robust OOD Segmentation
par: Song, Seungheon, et autres
Publié: (2025)
par: Song, Seungheon, et autres
Publié: (2025)
It's Time to Get It Right: Improving Analog Clock Reading and Clock-Hand Spatial Reasoning in Vision-Language Models
par: Choi, Jaeha, et autres
Publié: (2026)
par: Choi, Jaeha, et autres
Publié: (2026)
FEAT: Fashion Editing and Try-On from Any Design
par: Kwon, Soye, et autres
Publié: (2026)
par: Kwon, Soye, et autres
Publié: (2026)
Learning Temporal Cues by Predicting Objects Move for Multi-camera 3D Object Detection
par: Moon, Seokha, et autres
Publié: (2024)
par: Moon, Seokha, et autres
Publié: (2024)
TempCore: Are Video QA Benchmarks Temporally Grounded? A Frame Selection Sensitivity Analysis and Benchmark
par: Ok, Hyunjong, et autres
Publié: (2025)
par: Ok, Hyunjong, et autres
Publié: (2025)
BEM: Training-Free Background Embedding Memory for False-Positive Suppression in Real-Time Fixed-Background Camera
par: Park, Junwoo, et autres
Publié: (2026)
par: Park, Junwoo, et autres
Publié: (2026)
Long-term Pre-training for Temporal Action Detection with Transformers
par: Kim, Jihwan, et autres
Publié: (2024)
par: Kim, Jihwan, et autres
Publié: (2024)
GUIDE-CoT: Goal-driven and User-Informed Dynamic Estimation for Pedestrian Trajectory using Chain-of-Thought
par: Kim, Sungsik, et autres
Publié: (2025)
par: Kim, Sungsik, et autres
Publié: (2025)
Understanding the Effects of Distractors on Reasoning Vision-Language Models
par: Bae, Jiyun, et autres
Publié: (2025)
par: Bae, Jiyun, et autres
Publié: (2025)
Can MLLMs Reason About Visual Persuasion? Evaluating the Efficacy and Faithfulness of Reasoning
par: Lee, Naeun, et autres
Publié: (2026)
par: Lee, Naeun, et autres
Publié: (2026)
MutDet: Mutually Optimizing Pre-training for Remote Sensing Object Detection
par: Huang, Ziyue, et autres
Publié: (2024)
par: Huang, Ziyue, et autres
Publié: (2024)
VisDoT : Enhancing Visual Reasoning through Human-Like Interpretation Grounding and Decomposition of Thought
par: Lee, Eunsoo, et autres
Publié: (2026)
par: Lee, Eunsoo, et autres
Publié: (2026)
Unsupervised Attention Regularization Based Domain Adaptation for Oracle Character Recognition
par: Wang, Mei, et autres
Publié: (2024)
par: Wang, Mei, et autres
Publié: (2024)
Retaining and Enhancing Pre-trained Knowledge in Vision-Language Models with Prompt Ensembling
par: Kim, Donggeun, et autres
Publié: (2024)
par: Kim, Donggeun, et autres
Publié: (2024)
Jointly Learning Spatial, Angular, and Temporal Information for Enhanced Lane Detection
par: Alam, Muhammad Zeshan
Publié: (2024)
par: Alam, Muhammad Zeshan
Publié: (2024)
Do Pre-trained Models Benefit Equally in Continual Learning?
par: Lee, Kuan-Ying, et autres
Publié: (2022)
par: Lee, Kuan-Ying, et autres
Publié: (2022)
DiffusionLane: Diffusion Model for Lane Detection
par: Zhou, Kunyang, et autres
Publié: (2025)
par: Zhou, Kunyang, et autres
Publié: (2025)
Stay in your Lane: Role Specific Queries with Overlap Suppression Loss for Dense Video Captioning
par: Baek, Seung Hyup, et autres
Publié: (2026)
par: Baek, Seung Hyup, et autres
Publié: (2026)
Emerging Property of Masked Token for Effective Pre-training
par: Choi, Hyesong, et autres
Publié: (2024)
par: Choi, Hyesong, et autres
Publié: (2024)
Clothing agnostic Pre-inpainting Virtual Try-ON
par: Kim, Sehyun, et autres
Publié: (2025)
par: Kim, Sehyun, et autres
Publié: (2025)
Attention-based U-Net Method for Autonomous Lane Detection
par: Tangestanizadeh, Mohammadhamed, et autres
Publié: (2024)
par: Tangestanizadeh, Mohammadhamed, et autres
Publié: (2024)
Towards Privacy-preserved Pre-training of Remote Sensing Foundation Models with Federated Mutual-guidance Learning
par: Tan, Jieyi, et autres
Publié: (2025)
par: Tan, Jieyi, et autres
Publié: (2025)
GFSR: Geometric Fidelity and Spatial Refinement for Reliable Lane Detection
par: Wang, Tiancheng, et autres
Publié: (2026)
par: Wang, Tiancheng, et autres
Publié: (2026)
PropFly: Learning to Propagate via On-the-Fly Supervision from Pre-trained Video Diffusion Models
par: Seo, Wonyong, et autres
Publié: (2026)
par: Seo, Wonyong, et autres
Publié: (2026)
Lane-Keeping Control of Autonomous Vehicles Through a Soft-Constrained Iterative LQR
par: Lee, Der-Hau
Publié: (2023)
par: Lee, Der-Hau
Publié: (2023)
Guided Slot Attention for Unsupervised Video Object Segmentation
par: Lee, Minhyeok, et autres
Publié: (2023)
par: Lee, Minhyeok, et autres
Publié: (2023)
Selective Focus: Investigating Semantics Sensitivity in Post-training Quantization for Lane Detection
par: Fan, Yunqian, et autres
Publié: (2024)
par: Fan, Yunqian, et autres
Publié: (2024)
CountSteer: Steering Attention for Object Counting in Diffusion Models
par: Boo, Hyemin, et autres
Publié: (2025)
par: Boo, Hyemin, et autres
Publié: (2025)
LaneCorrect: Self-supervised Lane Detection
par: Nie, Ming, et autres
Publié: (2024)
par: Nie, Ming, et autres
Publié: (2024)
LanePerf: a Performance Estimation Framework for Lane Detection
par: Wu, Yin, et autres
Publié: (2025)
par: Wu, Yin, et autres
Publié: (2025)
Unified Editing of Panorama, 3D Scenes, and Videos Through Disentangled Self-Attention Injection
par: Kwon, Gihyun, et autres
Publié: (2024)
par: Kwon, Gihyun, et autres
Publié: (2024)
Transforming Static Images Using Generative Models for Video Salient Object Detection
par: Cho, Suhwan, et autres
Publié: (2024)
par: Cho, Suhwan, et autres
Publié: (2024)
HD Maps are Lane Detection Generalizers: A Novel Generative Framework for Single-Source Domain Generalization
par: Lee, Daeun, et autres
Publié: (2023)
par: Lee, Daeun, et autres
Publié: (2023)
Universal Few-Shot Spatial Control for Diffusion Models
par: Nguyen, Kiet T., et autres
Publié: (2025)
par: Nguyen, Kiet T., et autres
Publié: (2025)
Dual Prototype Attention for Unsupervised Video Object Segmentation
par: Cho, Suhwan, et autres
Publié: (2022)
par: Cho, Suhwan, et autres
Publié: (2022)
Classification Matters: Improving Video Action Detection with Class-Specific Attention
par: Lee, Jinsung, et autres
Publié: (2024)
par: Lee, Jinsung, et autres
Publié: (2024)
Attention Prompt Tuning: Parameter-efficient Adaptation of Pre-trained Models for Spatiotemporal Modeling
par: Bandara, Wele Gedara Chaminda, et autres
Publié: (2024)
par: Bandara, Wele Gedara Chaminda, et autres
Publié: (2024)
CAST: Cross-Attention in Space and Time for Video Action Recognition
par: Lee, Dongho, et autres
Publié: (2023)
par: Lee, Dongho, et autres
Publié: (2023)
Integrating Query-aware Segmentation and Cross-Attention for Robust VQA
par: Choi, Wonjun, et autres
Publié: (2024)
par: Choi, Wonjun, et autres
Publié: (2024)
Documents similaires
-
Controllable 3D Object Generation with Single Image Prompt
par: Lee, Jaeseok, et autres
Publié: (2025) -
Leveraging Text-Driven Semantic Variation for Robust OOD Segmentation
par: Song, Seungheon, et autres
Publié: (2025) -
It's Time to Get It Right: Improving Analog Clock Reading and Clock-Hand Spatial Reasoning in Vision-Language Models
par: Choi, Jaeha, et autres
Publié: (2026) -
FEAT: Fashion Editing and Try-On from Any Design
par: Kwon, Soye, et autres
Publié: (2026) -
Learning Temporal Cues by Predicting Objects Move for Multi-camera 3D Object Detection
par: Moon, Seokha, et autres
Publié: (2024)