Enregistré dans:
| Auteurs principaux: | Aryashad, Ardalan, Razmara, Parsa, Mahjoub, Amin, Azizi, Seyedarmin, Salmani, Mahdi, Firouzkouhi, Arad |
|---|---|
| Format: | Preprint |
| Publié: |
2025
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2510.03906 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
Memory-Efficient Vision Transformers: An Activation-Aware Mixed-Rank Compression Strategy
par: Azizi, Seyedarmin, et autres
Publié: (2024)
par: Azizi, Seyedarmin, et autres
Publié: (2024)
From Unstable to Playable: Stabilizing Angry Birds Levels via Object Segmentation
par: Farrokhimaleki, Mahdi, et autres
Publié: (2025)
par: Farrokhimaleki, Mahdi, et autres
Publié: (2025)
VISTA: Vision-Language Inference for Training-Free Stock Time-Series Analysis
par: Khezresmaeilzadeh, Tina, et autres
Publié: (2025)
par: Khezresmaeilzadeh, Tina, et autres
Publié: (2025)
Efficient Noise Mitigation for Enhancing Inference Accuracy in DNNs on Mixed-Signal Accelerators
par: Azizi, Seyedarmin, et autres
Publié: (2024)
par: Azizi, Seyedarmin, et autres
Publié: (2024)
Training-Free Acceleration of ViTs with Delayed Spatial Merging
par: Heo, Jung Hwan, et autres
Publié: (2023)
par: Heo, Jung Hwan, et autres
Publié: (2023)
PEANO-ViT: Power-Efficient Approximations of Non-Linearities in Vision Transformers
par: Sadeghi, Mohammad Erfan, et autres
Publié: (2024)
par: Sadeghi, Mohammad Erfan, et autres
Publié: (2024)
Preserving Localized Patch Semantics in VLMs
par: Esmaeilkhani, Parsa, et autres
Publié: (2026)
par: Esmaeilkhani, Parsa, et autres
Publié: (2026)
D2SL: Decouple Defogging and Semantic Learning for Foggy Domain-Adaptive Segmentation
par: Sun, Xuan, et autres
Publié: (2024)
par: Sun, Xuan, et autres
Publié: (2024)
From Words to Wavelengths: VLMs for Few-Shot Multispectral Object Detection
par: Nkegoum, Manuel, et autres
Publié: (2025)
par: Nkegoum, Manuel, et autres
Publié: (2025)
Beyond Sequences: A Benchmark for Atomic Hand-Object Interaction Using a Static RNN Encoder
par: Movahed, Yousef Azizi, et autres
Publié: (2025)
par: Movahed, Yousef Azizi, et autres
Publié: (2025)
CAFD: Concept-Aware DNN Fault Detection using VLMs
par: Abbasishahkoo, Amin, et autres
Publié: (2026)
par: Abbasishahkoo, Amin, et autres
Publié: (2026)
Single Image Defogging Using a Fourth-Order Telegraph PDE Guided by Physical Haze Modeling
par: Kumar, Manish, et autres
Publié: (2026)
par: Kumar, Manish, et autres
Publié: (2026)
Integration of Object Detection and Small VLMs for Construction Safety Hazard Identification
par: Adil, Muhammad, et autres
Publié: (2026)
par: Adil, Muhammad, et autres
Publié: (2026)
Intelligent Railroad Grade Crossing: Leveraging Semantic Segmentation and Object Detection for Enhanced Safety
par: Amin, Al, et autres
Publié: (2024)
par: Amin, Al, et autres
Publié: (2024)
Robust Object Detection with Pseudo Labels from VLMs using Per-Object Co-teaching
par: Bhaskar, Uday, et autres
Publié: (2025)
par: Bhaskar, Uday, et autres
Publié: (2025)
Toward Realistic Camouflaged Object Detection: Benchmarks and Method
par: Xin, Zhimeng, et autres
Publié: (2025)
par: Xin, Zhimeng, et autres
Publié: (2025)
Rewriting the Budget: A General Framework for Black-Box Attacks Under Cost Asymmetry
par: Salmani, Mahdi, et autres
Publié: (2025)
par: Salmani, Mahdi, et autres
Publié: (2025)
LLMs Meet VLMs: Boost Open Vocabulary Object Detection with Fine-grained Descriptors
par: Jin, Sheng, et autres
Publié: (2024)
par: Jin, Sheng, et autres
Publié: (2024)
Segment Any Crack: Deep Semantic Segmentation Adaptation for Crack Detection
par: Rostami, Ghodsiyeh, et autres
Publié: (2025)
par: Rostami, Ghodsiyeh, et autres
Publié: (2025)
Performance of Human Annotators in Object Detection and Segmentation of Remotely Sensed Data
par: Blushtein-Livnon, Roni, et autres
Publié: (2024)
par: Blushtein-Livnon, Roni, et autres
Publié: (2024)
Empowering Medical Imaging with Artificial Intelligence: A Review of Machine Learning Approaches for the Detection, and Segmentation of COVID-19 Using Radiographic and Tomographic Images
par: Mobarakeh, Sayed Amir Mousavi, et autres
Publié: (2024)
par: Mobarakeh, Sayed Amir Mousavi, et autres
Publié: (2024)
SceneDiff: A Benchmark and Method for Multiview Object Change Detection
par: Wu, Yuqun, et autres
Publié: (2025)
par: Wu, Yuqun, et autres
Publié: (2025)
Egocentric Human-Object Interaction Detection: A New Benchmark and Method
par: Deng, Kunyuan, et autres
Publié: (2025)
par: Deng, Kunyuan, et autres
Publié: (2025)
PatchGuard: Adversarially Robust Anomaly Detection and Localization through Vision Transformers and Pseudo Anomalies
par: Nafez, Mojtaba, et autres
Publié: (2025)
par: Nafez, Mojtaba, et autres
Publié: (2025)
All You Need for Object Detection: From Pixels, Points, and Prompts to Next-Gen Fusion and Multimodal LLMs/VLMs in Autonomous Vehicles
par: Boroujeni, Sayed Pedram Haeri, et autres
Publié: (2025)
par: Boroujeni, Sayed Pedram Haeri, et autres
Publié: (2025)
Sample-Efficient Expert Query Control in Active Imitation Learning via Conformal Prediction
par: Firouzkouhi, Arad, et autres
Publié: (2025)
par: Firouzkouhi, Arad, et autres
Publié: (2025)
From Blurry to Brilliant Detection: YOLO-Based Aerial Object Detection with Super Resolution
par: Nihal, Ragib Amin, et autres
Publié: (2024)
par: Nihal, Ragib Amin, et autres
Publié: (2024)
FBHM: Functional Benchmarking and Steering of VLMs for Hateful Meme Detection
par: Bhaskar, Paramananda, et autres
Publié: (2026)
par: Bhaskar, Paramananda, et autres
Publié: (2026)
Fever Detection with Infrared Thermography: Enhancing Accuracy through Machine Learning Techniques
par: Razmara, Parsa, et autres
Publié: (2024)
par: Razmara, Parsa, et autres
Publié: (2024)
CrispEdit: Low-Curvature Projections for Scalable Non-Destructive LLM Editing
par: Ikram, Zarif, et autres
Publié: (2026)
par: Ikram, Zarif, et autres
Publié: (2026)
An Analysis of Kalman Filter based Object Tracking Methods for Fast-Moving Tiny Objects
par: Singh, Prithvi Raj, et autres
Publié: (2025)
par: Singh, Prithvi Raj, et autres
Publié: (2025)
Teaching VLMs to Localize Specific Objects from In-context Examples
par: Doveh, Sivan, et autres
Publié: (2024)
par: Doveh, Sivan, et autres
Publié: (2024)
PIN: Positional Insert Unlocks Object Localisation Abilities in VLMs
par: Dorkenwald, Michael, et autres
Publié: (2024)
par: Dorkenwald, Michael, et autres
Publié: (2024)
Cross-Domain Semantic Segmentation on Inconsistent Taxonomy using VLMs
par: Lim, Jeongkee, et autres
Publié: (2024)
par: Lim, Jeongkee, et autres
Publié: (2024)
Benchmarking Compact VLMs for Clip-Level Surveillance Anomaly Detection Under Weak Supervision
par: Borodin, Kirill, et autres
Publié: (2026)
par: Borodin, Kirill, et autres
Publié: (2026)
Benchmarking VLMs' Reasoning About Persuasive Atypical Images
par: Malakouti, Sina, et autres
Publié: (2024)
par: Malakouti, Sina, et autres
Publié: (2024)
DDX-TRACE: A Benchmark for Medical Diagnostic Trajectories in VLMs
par: Pan, Jiazhen, et autres
Publié: (2026)
par: Pan, Jiazhen, et autres
Publié: (2026)
Stepping VLMs onto the Court: Benchmarking Spatial Intelligence in Sports
par: Yang, Yuchen, et autres
Publié: (2026)
par: Yang, Yuchen, et autres
Publié: (2026)
DRIVESPATIAL: A Benchmark for Spatiotemporal Intelligence in VLMs for Autonomous Driving
par: Vo, Hao, et autres
Publié: (2026)
par: Vo, Hao, et autres
Publié: (2026)
BareBones: Benchmarking Zero-Shot Geometric Comprehension in VLMs
par: Baranwal, Aaditya, et autres
Publié: (2026)
par: Baranwal, Aaditya, et autres
Publié: (2026)
Documents similaires
-
Memory-Efficient Vision Transformers: An Activation-Aware Mixed-Rank Compression Strategy
par: Azizi, Seyedarmin, et autres
Publié: (2024) -
From Unstable to Playable: Stabilizing Angry Birds Levels via Object Segmentation
par: Farrokhimaleki, Mahdi, et autres
Publié: (2025) -
VISTA: Vision-Language Inference for Training-Free Stock Time-Series Analysis
par: Khezresmaeilzadeh, Tina, et autres
Publié: (2025) -
Efficient Noise Mitigation for Enhancing Inference Accuracy in DNNs on Mixed-Signal Accelerators
par: Azizi, Seyedarmin, et autres
Publié: (2024) -
Training-Free Acceleration of ViTs with Delayed Spatial Merging
par: Heo, Jung Hwan, et autres
Publié: (2023)