Enregistré dans:
| Auteurs principaux: | Wang, Song, Li, Lingling, Santos, Marcus, Wang, Guanghui |
|---|---|
| Format: | Preprint |
| Publié: |
2026
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2602.13555 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
BEV-TSR: Text-Scene Retrieval in BEV Space for Autonomous Driving
par: Tang, Tao, et autres
Publié: (2024)
par: Tang, Tao, et autres
Publié: (2024)
GOLD-BEV: GrOund and aeriaL Data for Dense Semantic BEV Mapping of Dynamic Scenes
par: Niemeijer, Joshua, et autres
Publié: (2026)
par: Niemeijer, Joshua, et autres
Publié: (2026)
Segment Concealed Objects with Incomplete Supervision
par: He, Chunming, et autres
Publié: (2025)
par: He, Chunming, et autres
Publié: (2025)
Beyond BEV: Optimizing Point-Level Tokens for Collaborative Perception
par: Li, Yang, et autres
Publié: (2025)
par: Li, Yang, et autres
Publié: (2025)
BEVWorld: A Multimodal World Simulator for Autonomous Driving via Scene-Level BEV Latents
par: Zhang, Yumeng, et autres
Publié: (2024)
par: Zhang, Yumeng, et autres
Publié: (2024)
Nested Unfolding Network for Real-World Concealed Object Segmentation
par: He, Chunming, et autres
Publié: (2025)
par: He, Chunming, et autres
Publié: (2025)
ChatBEV: A Visual Language Model that Understands BEV Maps
par: Xu, Qingyao, et autres
Publié: (2025)
par: Xu, Qingyao, et autres
Publié: (2025)
MPerS: Dynamic MLLM MixExperts Perception-Guided Remote Sensing Scene Segmentation
par: Wang, Ziyi, et autres
Publié: (2026)
par: Wang, Ziyi, et autres
Publié: (2026)
SCALER: SAM-Enhanced Collaborative Learning for Label-Deficient Concealed Object Segmentation
par: He, Chunming, et autres
Publié: (2025)
par: He, Chunming, et autres
Publié: (2025)
DualCross: Cross-Modality Cross-Domain Adaptation for Monocular BEV Perception
par: Man, Yunze, et autres
Publié: (2023)
par: Man, Yunze, et autres
Publié: (2023)
MTA: Multimodal Task Alignment for BEV Perception and Captioning
par: Ma, Yunsheng, et autres
Publié: (2024)
par: Ma, Yunsheng, et autres
Publié: (2024)
Reversible Unfolding Network for Concealed Visual Perception with Generative Refinement
par: He, Chunming, et autres
Publié: (2025)
par: He, Chunming, et autres
Publié: (2025)
City-VLM: Towards Multidomain Perception Scene Understanding via Multimodal Incomplete Learning
par: Sun, Penglei, et autres
Publié: (2025)
par: Sun, Penglei, et autres
Publié: (2025)
Discriminative Perception via Anchored Description for Reasoning Segmentation
par: Yang, Tao, et autres
Publié: (2026)
par: Yang, Tao, et autres
Publié: (2026)
LaneDiffusion: Improving Centerline Graph Learning via Prior Injected BEV Feature Generation
par: Wang, Zijie, et autres
Publié: (2025)
par: Wang, Zijie, et autres
Publié: (2025)
GA-VLN: Geometry-Aware BEV Representation for Efficient Vision-Language Navigation
par: Yang, Jiahao, et autres
Publié: (2026)
par: Yang, Jiahao, et autres
Publié: (2026)
Keypoints as Dynamic Centroids for Unified Human Pose and Segmentation
par: Ahmad, Niaz, et autres
Publié: (2025)
par: Ahmad, Niaz, et autres
Publié: (2025)
Ref-AVS: Refer and Segment Objects in Audio-Visual Scenes
par: Wang, Yaoting, et autres
Publié: (2024)
par: Wang, Yaoting, et autres
Publié: (2024)
TempBEV: Improving Learned BEV Encoders with Combined Image and BEV Space Temporal Aggregation
par: Monninger, Thomas, et autres
Publié: (2024)
par: Monninger, Thomas, et autres
Publié: (2024)
CycleBEV: Regularizing View Transformation Networks via View Cycle Consistency for Bird's-Eye-View Semantic Segmentation
par: Hong, Jeongbin, et autres
Publié: (2026)
par: Hong, Jeongbin, et autres
Publié: (2026)
Leveraging Labelled Data Knowledge: A Cooperative Rectification Learning Network for Semi-supervised 3D Medical Image Segmentation
par: Wang, Yanyan, et autres
Publié: (2025)
par: Wang, Yanyan, et autres
Publié: (2025)
Learning Segmented 3D Gaussians via Efficient Feature Unprojection for Zero-shot Neural Scene Segmentation
par: Dou, Bin, et autres
Publié: (2024)
par: Dou, Bin, et autres
Publié: (2024)
See in Depth: Training-Free Surgical Scene Segmentation with Monocular Depth Priors
par: Yang, Kunyi, et autres
Publié: (2025)
par: Yang, Kunyi, et autres
Publié: (2025)
Antelope: Potent and Concealed Jailbreak Attack Strategy
par: Zhao, Xin, et autres
Publié: (2024)
par: Zhao, Xin, et autres
Publié: (2024)
Interruption-Aware Cooperative Perception for V2X Communication-Aided Autonomous Driving
par: Ren, Shunli, et autres
Publié: (2023)
par: Ren, Shunli, et autres
Publié: (2023)
Beyond ZOH: Advanced Discretization Strategies for Vision Mamba
par: Ibrahim, Fady, et autres
Publié: (2026)
par: Ibrahim, Fady, et autres
Publié: (2026)
A Survey on Mamba Architecture for Vision Applications
par: Ibrahim, Fady, et autres
Publié: (2025)
par: Ibrahim, Fady, et autres
Publié: (2025)
VISUALCENT: Visual Human Analysis using Dynamic Centroid Representation
par: Ahmad, Niaz, et autres
Publié: (2025)
par: Ahmad, Niaz, et autres
Publié: (2025)
PerspectiveNet: Multi-View Perception for Dynamic Scene Understanding
par: Nguyen, Vinh
Publié: (2024)
par: Nguyen, Vinh
Publié: (2024)
Enhancing Shape Perception and Segmentation Consistency for Industrial Image Inspection
par: Mao, Guoxuan, et autres
Publié: (2025)
par: Mao, Guoxuan, et autres
Publié: (2025)
RIDE: Retinex-Informed Decoupling for Exposing Concealed Objects
par: He, Chunming, et autres
Publié: (2026)
par: He, Chunming, et autres
Publié: (2026)
Sparse BEV Fusion with Self-View Consistency for Multi-View Detection and Tracking
par: Toida, Keisuke, et autres
Publié: (2025)
par: Toida, Keisuke, et autres
Publié: (2025)
MapFusion: A Novel BEV Feature Fusion Network for Multi-modal Map Construction
par: Hao, Xiaoshuai, et autres
Publié: (2025)
par: Hao, Xiaoshuai, et autres
Publié: (2025)
Point Cloud Based Scene Segmentation: A Survey
par: Halperin, Dan, et autres
Publié: (2025)
par: Halperin, Dan, et autres
Publié: (2025)
Decoupling the Image Perception and Multimodal Reasoning for Reasoning Segmentation with Digital Twin Representations
par: Li, Yizhen, et autres
Publié: (2025)
par: Li, Yizhen, et autres
Publié: (2025)
RaLiBEV: Radar and LiDAR BEV Fusion Learning for Anchor Box Free Object Detection Systems
par: Yang, Yanlong, et autres
Publié: (2022)
par: Yang, Yanlong, et autres
Publié: (2022)
A New Dataset and Comparative Study for Aphid Cluster Detection and Segmentation in Sorghum Fields
par: Rahman, Raiyan, et autres
Publié: (2024)
par: Rahman, Raiyan, et autres
Publié: (2024)
InfBaGel: Human-Object-Scene Interaction Generation with Dynamic Perception and Iterative Refinement
par: Zou, Yude, et autres
Publié: (2026)
par: Zou, Yude, et autres
Publié: (2026)
LetsMap: Unsupervised Representation Learning for Semantic BEV Mapping
par: Gosala, Nikhil, et autres
Publié: (2024)
par: Gosala, Nikhil, et autres
Publié: (2024)
ALPS: An Auto-Labeling and Pre-training Scheme for Remote Sensing Segmentation With Segment Anything Model
par: Zhang, Song, et autres
Publié: (2024)
par: Zhang, Song, et autres
Publié: (2024)
Documents similaires
-
BEV-TSR: Text-Scene Retrieval in BEV Space for Autonomous Driving
par: Tang, Tao, et autres
Publié: (2024) -
GOLD-BEV: GrOund and aeriaL Data for Dense Semantic BEV Mapping of Dynamic Scenes
par: Niemeijer, Joshua, et autres
Publié: (2026) -
Segment Concealed Objects with Incomplete Supervision
par: He, Chunming, et autres
Publié: (2025) -
Beyond BEV: Optimizing Point-Level Tokens for Collaborative Perception
par: Li, Yang, et autres
Publié: (2025) -
BEVWorld: A Multimodal World Simulator for Autonomous Driving via Scene-Level BEV Latents
par: Zhang, Yumeng, et autres
Publié: (2024)