Enregistré dans:
| Auteurs principaux: | Sufian, Abu, Ghosh, Anirudha, Barman, Debaditya, Leo, Marco, Distante, Cosimo |
|---|---|
| Format: | Preprint |
| Publié: |
2025
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2508.19298 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
Can Vision Transformers with ResNet's Global Features Fairly Authenticate Demographic Faces?
par: Sufian, Abu, et autres
Publié: (2025)
par: Sufian, Abu, et autres
Publié: (2025)
Context-Aware Pesticide Recommendation via Few-Shot Pest Recognition for Precision Agriculture
par: Ghosh, Anirudha, et autres
Publié: (2026)
par: Ghosh, Anirudha, et autres
Publié: (2026)
T2IBias: Uncovering Societal Bias Encoded in the Latent Space of Text-to-Image Generative Models
par: Sufian, Abu, et autres
Publié: (2025)
par: Sufian, Abu, et autres
Publié: (2025)
Cross-Modal Mapping and Dual-Branch Reconstruction for 2D-3D Multimodal Industrial Anomaly Detection
par: Daci, Radia, et autres
Publié: (2026)
par: Daci, Radia, et autres
Publié: (2026)
BiasICL: In-Context Learning and Demographic Biases of Vision Language Models
par: Xu, Sonnet, et autres
Publié: (2025)
par: Xu, Sonnet, et autres
Publié: (2025)
VLM-PAR: A Vision Language Model for Pedestrian Attribute Recognition
par: Sellam, Abdellah Zakaria, et autres
Publié: (2025)
par: Sellam, Abdellah Zakaria, et autres
Publié: (2025)
Real-Time Human Fall Detection using a Lightweight Pose Estimation Technique
par: Alam, Ekram, et autres
Publié: (2024)
par: Alam, Ekram, et autres
Publié: (2024)
GLaRE: A Graph-based Landmark Region Embedding Network for Emotion Recognition
par: Maji, Debasis, et autres
Publié: (2025)
par: Maji, Debasis, et autres
Publié: (2025)
Human Fall Detection using Transfer Learning-based 3D CNN
par: Alam, Ekram, et autres
Publié: (2025)
par: Alam, Ekram, et autres
Publié: (2025)
Demographic Bias of Expert-Level Vision-Language Foundation Models in Medical Imaging
par: Yang, Yuzhe, et autres
Publié: (2024)
par: Yang, Yuzhe, et autres
Publié: (2024)
Markerless Stride Length estimation in Athletic using Pose Estimation with monocular vision
par: Skorupski, Patryk, et autres
Publié: (2025)
par: Skorupski, Patryk, et autres
Publié: (2025)
Predicting the Next Action by Modeling the Abstract Goal
par: Roy, Debaditya, et autres
Publié: (2022)
par: Roy, Debaditya, et autres
Publié: (2022)
Locating Demographic Bias at the Attention-Head Level in CLIP's Vision Encoder
par: Yasser, Alaa, et autres
Publié: (2026)
par: Yasser, Alaa, et autres
Publié: (2026)
Demographic and Linguistic Bias Evaluation in Omnimodal Language Models
par: Elobaid, Alaa
Publié: (2026)
par: Elobaid, Alaa
Publié: (2026)
Beyond Linear Bottlenecks: Spline-Based Knowledge Distillation for Culturally Diverse Art Style Classification
par: Sellam, Abdellah Zakaria, et autres
Publié: (2025)
par: Sellam, Abdellah Zakaria, et autres
Publié: (2025)
D-TrAttUnet: Toward Hybrid CNN-Transformer Architecture for Generic and Subtle Segmentation in Medical Images
par: Bougourzi, Fares, et autres
Publié: (2024)
par: Bougourzi, Fares, et autres
Publié: (2024)
How Confident are Video Models? Empowering Video Models to Express their Uncertainty
par: Mei, Zhiting, et autres
Publié: (2025)
par: Mei, Zhiting, et autres
Publié: (2025)
Physically Grounded Vision-Language Models for Robotic Manipulation
par: Gao, Jensen, et autres
Publié: (2023)
par: Gao, Jensen, et autres
Publié: (2023)
Invisible Attributes, Visible Biases: Exploring Demographic Shortcuts in MRI-based Alzheimer's Disease Classification
par: Achara, Akshit, et autres
Publié: (2025)
par: Achara, Akshit, et autres
Publié: (2025)
When Cars Have Stereotypes: Auditing Demographic Bias in Objects from Text-to-Image Models
par: Choi, Dasol, et autres
Publié: (2025)
par: Choi, Dasol, et autres
Publié: (2025)
Boosting Hyperspectral Image Classification with Gate-Shift-Fuse Mechanisms in a Novel CNN-Transformer Approach
par: Guerri, Mohamed Fadhlallah, et autres
Publié: (2024)
par: Guerri, Mohamed Fadhlallah, et autres
Publié: (2024)
MINT-Demo: Membership Inference Test Demonstrator
par: DeAlcala, Daniel, et autres
Publié: (2025)
par: DeAlcala, Daniel, et autres
Publié: (2025)
Instruction-Evidence Contrastive Dual-Stream Decoding for Grounded Vision-Language Reasoning
par: Bangde, Yashwant Pravinrao, et autres
Publié: (2026)
par: Bangde, Yashwant Pravinrao, et autres
Publié: (2026)
Egocentric Bias in Vision-Language Models
par: Wang, Maijunxian, et autres
Publié: (2026)
par: Wang, Maijunxian, et autres
Publié: (2026)
Fairness Under Cover: Evaluating the Impact of Occlusions on Demographic Bias in Facial Recognition
par: Mamede, Rafael M., et autres
Publié: (2024)
par: Mamede, Rafael M., et autres
Publié: (2024)
When AI and Experts Agree on Error: Intrinsic Ambiguity in Dermatoscopic Images
par: Cino, Loris, et autres
Publié: (2026)
par: Cino, Loris, et autres
Publié: (2026)
Mitigating Bias with Words: Inducing Demographic Ambiguity in Face Recognition Templates by Text Encoding
par: Chettaoui, Tahar, et autres
Publié: (2025)
par: Chettaoui, Tahar, et autres
Publié: (2025)
Demographic Fairness in Multimodal LLMs: A Benchmark of Gender and Ethnicity Bias in Face Verification
par: Öztürk, Ünsal, et autres
Publié: (2026)
par: Öztürk, Ünsal, et autres
Publié: (2026)
Text Speaks Louder than Vision: ASCII Art Reveals Textual Biases in Vision-Language Models
par: Wang, Zhaochen, et autres
Publié: (2025)
par: Wang, Zhaochen, et autres
Publié: (2025)
Blind to Position, Biased in Language: Probing Mid-Layer Representational Bias in Vision-Language Encoders for Zero-Shot Language-Grounded Spatial Understanding
par: An, Na Min, et autres
Publié: (2025)
par: An, Na Min, et autres
Publié: (2025)
LoLA-SpecViT: Local Attention SwiGLU Vision Transformer with LoRA for Hyperspectral Imaging
par: Zidi, Fadi Abdeladhim, et autres
Publié: (2025)
par: Zidi, Fadi Abdeladhim, et autres
Publié: (2025)
Relaxed Rotational Equivariance via $G$-Biases in Vision
par: Wu, Zhiqiang, et autres
Publié: (2024)
par: Wu, Zhiqiang, et autres
Publié: (2024)
VideoGameQA-Bench: Evaluating Vision-Language Models for Video Game Quality Assurance
par: Taesiri, Mohammad Reza, et autres
Publié: (2025)
par: Taesiri, Mohammad Reza, et autres
Publié: (2025)
Generating Key Postures of Bharatanatyam Adavus with Pose Estimation
par: Kamble, Jagadish Kashinath, et autres
Publié: (2026)
par: Kamble, Jagadish Kashinath, et autres
Publié: (2026)
Empirical Recipes for Efficient and Compact Vision-Language Models
par: Huang, Jiabo, et autres
Publié: (2026)
par: Huang, Jiabo, et autres
Publié: (2026)
Uncovering Bias in Large Vision-Language Models with Counterfactuals
par: Howard, Phillip, et autres
Publié: (2024)
par: Howard, Phillip, et autres
Publié: (2024)
C-DiffDet+: Fusing Global Scene Context with Generative Denoising for High-Fidelity Car Damage Detection
par: Sellam, Abdellah Zakaria, et autres
Publié: (2025)
par: Sellam, Abdellah Zakaria, et autres
Publié: (2025)
VLM See, Robot Do: Human Demo Video to Robot Action Plan via Vision Language Model
par: Wang, Beichen, et autres
Publié: (2024)
par: Wang, Beichen, et autres
Publié: (2024)
SDGBiasBench: Benchmarking and Mitigating Vision--Language Models' Biases in Sustainable Development Goals
par: Lin, Zihang, et autres
Publié: (2026)
par: Lin, Zihang, et autres
Publié: (2026)
An Empirical Study on the Fairness of Foundation Models for Multi-Organ Image Segmentation
par: Li, Qin, et autres
Publié: (2024)
par: Li, Qin, et autres
Publié: (2024)
Documents similaires
-
Can Vision Transformers with ResNet's Global Features Fairly Authenticate Demographic Faces?
par: Sufian, Abu, et autres
Publié: (2025) -
Context-Aware Pesticide Recommendation via Few-Shot Pest Recognition for Precision Agriculture
par: Ghosh, Anirudha, et autres
Publié: (2026) -
T2IBias: Uncovering Societal Bias Encoded in the Latent Space of Text-to-Image Generative Models
par: Sufian, Abu, et autres
Publié: (2025) -
Cross-Modal Mapping and Dual-Branch Reconstruction for 2D-3D Multimodal Industrial Anomaly Detection
par: Daci, Radia, et autres
Publié: (2026) -
BiasICL: In-Context Learning and Demographic Biases of Vision Language Models
par: Xu, Sonnet, et autres
Publié: (2025)