:: Library Catalog

Image de couverture de livre

Enregistré dans:

Détails bibliographiques
Auteurs principaux:	Wang, Song, Li, Lingling, Santos, Marcus, Wang, Guanghui
Format:	Preprint
Publié:	2026
Sujets:	Computer Vision and Pattern Recognition Artificial Intelligence
Accès en ligne:	https://arxiv.org/abs/2602.13555
Tags:	Ajouter un tag Pas de tags, Soyez le premier à ajouter un tag!

Documents similaires

BEV-TSR: Text-Scene Retrieval in BEV Space for Autonomous Driving
par: Tang, Tao, et autres
Publié: (2024)

GOLD-BEV: GrOund and aeriaL Data for Dense Semantic BEV Mapping of Dynamic Scenes
par: Niemeijer, Joshua, et autres
Publié: (2026)

Segment Concealed Objects with Incomplete Supervision
par: He, Chunming, et autres
Publié: (2025)

Beyond BEV: Optimizing Point-Level Tokens for Collaborative Perception
par: Li, Yang, et autres
Publié: (2025)

BEVWorld: A Multimodal World Simulator for Autonomous Driving via Scene-Level BEV Latents
par: Zhang, Yumeng, et autres
Publié: (2024)

Nested Unfolding Network for Real-World Concealed Object Segmentation
par: He, Chunming, et autres
Publié: (2025)

ChatBEV: A Visual Language Model that Understands BEV Maps
par: Xu, Qingyao, et autres
Publié: (2025)

MPerS: Dynamic MLLM MixExperts Perception-Guided Remote Sensing Scene Segmentation
par: Wang, Ziyi, et autres
Publié: (2026)

SCALER: SAM-Enhanced Collaborative Learning for Label-Deficient Concealed Object Segmentation
par: He, Chunming, et autres
Publié: (2025)

DualCross: Cross-Modality Cross-Domain Adaptation for Monocular BEV Perception
par: Man, Yunze, et autres
Publié: (2023)

MTA: Multimodal Task Alignment for BEV Perception and Captioning
par: Ma, Yunsheng, et autres
Publié: (2024)

Reversible Unfolding Network for Concealed Visual Perception with Generative Refinement
par: He, Chunming, et autres
Publié: (2025)

City-VLM: Towards Multidomain Perception Scene Understanding via Multimodal Incomplete Learning
par: Sun, Penglei, et autres
Publié: (2025)

Discriminative Perception via Anchored Description for Reasoning Segmentation
par: Yang, Tao, et autres
Publié: (2026)

LaneDiffusion: Improving Centerline Graph Learning via Prior Injected BEV Feature Generation
par: Wang, Zijie, et autres
Publié: (2025)

GA-VLN: Geometry-Aware BEV Representation for Efficient Vision-Language Navigation
par: Yang, Jiahao, et autres
Publié: (2026)

Keypoints as Dynamic Centroids for Unified Human Pose and Segmentation
par: Ahmad, Niaz, et autres
Publié: (2025)

Ref-AVS: Refer and Segment Objects in Audio-Visual Scenes
par: Wang, Yaoting, et autres
Publié: (2024)

TempBEV: Improving Learned BEV Encoders with Combined Image and BEV Space Temporal Aggregation
par: Monninger, Thomas, et autres
Publié: (2024)

CycleBEV: Regularizing View Transformation Networks via View Cycle Consistency for Bird's-Eye-View Semantic Segmentation
par: Hong, Jeongbin, et autres
Publié: (2026)

Leveraging Labelled Data Knowledge: A Cooperative Rectification Learning Network for Semi-supervised 3D Medical Image Segmentation
par: Wang, Yanyan, et autres
Publié: (2025)

Learning Segmented 3D Gaussians via Efficient Feature Unprojection for Zero-shot Neural Scene Segmentation
par: Dou, Bin, et autres
Publié: (2024)

See in Depth: Training-Free Surgical Scene Segmentation with Monocular Depth Priors
par: Yang, Kunyi, et autres
Publié: (2025)

Antelope: Potent and Concealed Jailbreak Attack Strategy
par: Zhao, Xin, et autres
Publié: (2024)

Interruption-Aware Cooperative Perception for V2X Communication-Aided Autonomous Driving
par: Ren, Shunli, et autres
Publié: (2023)

Beyond ZOH: Advanced Discretization Strategies for Vision Mamba
par: Ibrahim, Fady, et autres
Publié: (2026)

A Survey on Mamba Architecture for Vision Applications
par: Ibrahim, Fady, et autres
Publié: (2025)

VISUALCENT: Visual Human Analysis using Dynamic Centroid Representation
par: Ahmad, Niaz, et autres
Publié: (2025)

PerspectiveNet: Multi-View Perception for Dynamic Scene Understanding
par: Nguyen, Vinh
Publié: (2024)

Enhancing Shape Perception and Segmentation Consistency for Industrial Image Inspection
par: Mao, Guoxuan, et autres
Publié: (2025)

RIDE: Retinex-Informed Decoupling for Exposing Concealed Objects
par: He, Chunming, et autres
Publié: (2026)

Sparse BEV Fusion with Self-View Consistency for Multi-View Detection and Tracking
par: Toida, Keisuke, et autres
Publié: (2025)

MapFusion: A Novel BEV Feature Fusion Network for Multi-modal Map Construction
par: Hao, Xiaoshuai, et autres
Publié: (2025)

Point Cloud Based Scene Segmentation: A Survey
par: Halperin, Dan, et autres
Publié: (2025)

Decoupling the Image Perception and Multimodal Reasoning for Reasoning Segmentation with Digital Twin Representations
par: Li, Yizhen, et autres
Publié: (2025)

RaLiBEV: Radar and LiDAR BEV Fusion Learning for Anchor Box Free Object Detection Systems
par: Yang, Yanlong, et autres
Publié: (2022)

A New Dataset and Comparative Study for Aphid Cluster Detection and Segmentation in Sorghum Fields
par: Rahman, Raiyan, et autres
Publié: (2024)

InfBaGel: Human-Object-Scene Interaction Generation with Dynamic Perception and Iterative Refinement
par: Zou, Yude, et autres
Publié: (2026)

LetsMap: Unsupervised Representation Learning for Semantic BEV Mapping
par: Gosala, Nikhil, et autres
Publié: (2024)

ALPS: An Auto-Labeling and Pre-training Scheme for Remote Sensing Segmentation With Segment Anything Model
par: Zhang, Song, et autres
Publié: (2024)