Gespeichert in:
| 1. Verfasser: | Islam, Md Jahidul |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2026
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2603.16653 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
ReHARK: Refined Hybrid Adaptive RBF Kernels for Robust One-Shot Vision-Language Adaptation
von: Islam, Md Jahidul
Veröffentlicht: (2026)
von: Islam, Md Jahidul
Veröffentlicht: (2026)
HeGraphAdapter: Tuning Multi-Modal Vision-Language Models with Heterogeneous Graph Adapter
von: Zhao, Yumiao, et al.
Veröffentlicht: (2024)
von: Zhao, Yumiao, et al.
Veröffentlicht: (2024)
W-DUALMINE: Reliability-Weighted Dual-Expert Fusion With Residual Correlation Preservation for Medical Image Fusion
von: Islam, Md. Jahidul
Veröffentlicht: (2026)
von: Islam, Md. Jahidul
Veröffentlicht: (2026)
HiRQA: Hierarchical Ranking and Quality Alignment for Opinion-Unaware Image Quality Assessment
von: Ramesh, Vaishnav, et al.
Veröffentlicht: (2025)
von: Ramesh, Vaishnav, et al.
Veröffentlicht: (2025)
DGIQA: Depth-guided Feature Attention and Refinement for Generalizable Image Quality Assessment
von: Ramesh, Vaishnav, et al.
Veröffentlicht: (2025)
von: Ramesh, Vaishnav, et al.
Veröffentlicht: (2025)
Robust Calibration of Large Vision-Language Adapters
von: Murugesan, Balamurali, et al.
Veröffentlicht: (2024)
von: Murugesan, Balamurali, et al.
Veröffentlicht: (2024)
AquaFuse: Waterbody Fusion for Physics Guided View Synthesis of Underwater Scenes
von: Siddique, Md Abu Bakr, et al.
Veröffentlicht: (2024)
von: Siddique, Md Abu Bakr, et al.
Veröffentlicht: (2024)
CLIP-Adapter: Better Vision-Language Models with Feature Adapters
von: Gao, Peng, et al.
Veröffentlicht: (2021)
von: Gao, Peng, et al.
Veröffentlicht: (2021)
T-Gated Adapter: A Lightweight Temporal Adapter for Vision-Language Medical Segmentation
von: Khadka, Pranjal
Veröffentlicht: (2026)
von: Khadka, Pranjal
Veröffentlicht: (2026)
Test-time Alignment-Enhanced Adapter for Vision-Language Models
von: Tong, Baoshun, et al.
Veröffentlicht: (2024)
von: Tong, Baoshun, et al.
Veröffentlicht: (2024)
Isolated Bangla Handwritten Character Classification using Transfer Learning
von: Karim, Abdul, et al.
Veröffentlicht: (2025)
von: Karim, Abdul, et al.
Veröffentlicht: (2025)
Improving Concept Alignment in Vision-Language Concept Bottleneck Models
von: Selvaraj, Nithish Muthuchamy, et al.
Veröffentlicht: (2024)
von: Selvaraj, Nithish Muthuchamy, et al.
Veröffentlicht: (2024)
UStyle: Waterbody Style Transfer of Underwater Scenes by Depth-Guided Feature Synthesis
von: Siddique, Md Abu Bakr, et al.
Veröffentlicht: (2025)
von: Siddique, Md Abu Bakr, et al.
Veröffentlicht: (2025)
IKIWISI: An Interactive Visual Pattern Generator for Evaluating the Reliability of Vision-Language Models Without Ground Truth
von: Islam, Md Touhidul, et al.
Veröffentlicht: (2025)
von: Islam, Md Touhidul, et al.
Veröffentlicht: (2025)
Vision-Language Models for Automated Chest X-ray Interpretation: Leveraging ViT and GPT-2
von: Islam, Md. Rakibul, et al.
Veröffentlicht: (2025)
von: Islam, Md. Rakibul, et al.
Veröffentlicht: (2025)
Meta-Adapter: An Online Few-shot Learner for Vision-Language Model
von: Cheng, Cheng, et al.
Veröffentlicht: (2023)
von: Cheng, Cheng, et al.
Veröffentlicht: (2023)
Single-Step Latent Diffusion for Underwater Image Restoration
von: Wu, Jiayi, et al.
Veröffentlicht: (2025)
von: Wu, Jiayi, et al.
Veröffentlicht: (2025)
ReVisionLLM: Recursive Vision-Language Model for Temporal Grounding in Hour-Long Videos
von: Hannan, Tanveer, et al.
Veröffentlicht: (2024)
von: Hannan, Tanveer, et al.
Veröffentlicht: (2024)
Boosting Continual Learning of Vision-Language Models via Mixture-of-Experts Adapters
von: Yu, Jiazuo, et al.
Veröffentlicht: (2024)
von: Yu, Jiazuo, et al.
Veröffentlicht: (2024)
A Robust Deep Learning Framework for Bangla License Plate Recognition Using YOLO and Vision-Language OCR
von: Hasin, Nayeb, et al.
Veröffentlicht: (2026)
von: Hasin, Nayeb, et al.
Veröffentlicht: (2026)
Few-Shot-Based Modular Image-to-Video Adapter for Diffusion Models
von: Li, Zhenhao, et al.
Veröffentlicht: (2025)
von: Li, Zhenhao, et al.
Veröffentlicht: (2025)
An Explainable Vision-Language Model Framework with Adaptive PID-Tversky Loss for Lumbar Spinal Stenosis Diagnosis
von: Sk., Md. Sajeebul Islam, et al.
Veröffentlicht: (2026)
von: Sk., Md. Sajeebul Islam, et al.
Veröffentlicht: (2026)
Mema: Memory-Augmented Adapter for Enhanced Vision-Language Understanding
von: Liu, Ying, et al.
Veröffentlicht: (2026)
von: Liu, Ying, et al.
Veröffentlicht: (2026)
Multi-Modal Adapter for Vision-Language Models
von: Seputis, Dominykas, et al.
Veröffentlicht: (2024)
von: Seputis, Dominykas, et al.
Veröffentlicht: (2024)
DIMoE-Adapters: Dynamic Expert Evolution for Continual Learning in Vision-Language Models
von: Qin, Mengxin, et al.
Veröffentlicht: (2026)
von: Qin, Mengxin, et al.
Veröffentlicht: (2026)
Skip Tuning: Pre-trained Vision-Language Models are Effective and Efficient Adapters Themselves
von: Wu, Shihan, et al.
Veröffentlicht: (2024)
von: Wu, Shihan, et al.
Veröffentlicht: (2024)
QueryAdapter: Rapid Adaptation of Vision-Language Models in Response to Natural Language Queries
von: Chapman, Nicolas Harvey, et al.
Veröffentlicht: (2025)
von: Chapman, Nicolas Harvey, et al.
Veröffentlicht: (2025)
Unveiling the Visual Counting Bottleneck in Vision-Language Models
von: Pang, Xingzhou, et al.
Veröffentlicht: (2026)
von: Pang, Xingzhou, et al.
Veröffentlicht: (2026)
TAB: Transformer Attention Bottlenecks enable User Intervention and Debugging in Vision-Language Models
von: Rahmanzadehgervi, Pooyan, et al.
Veröffentlicht: (2024)
von: Rahmanzadehgervi, Pooyan, et al.
Veröffentlicht: (2024)
A Two-Stage Multitask Vision-Language Framework for Explainable Crop Disease Visual Question Answering
von: Hossain, Md. Zahid, et al.
Veröffentlicht: (2026)
von: Hossain, Md. Zahid, et al.
Veröffentlicht: (2026)
Diagnosing Bottlenecks in Data Visualization Understanding by Vision-Language Models
von: Tartaglini, Alexa R., et al.
Veröffentlicht: (2025)
von: Tartaglini, Alexa R., et al.
Veröffentlicht: (2025)
Rethinking Bottlenecks in Safety Fine-Tuning of Vision Language Models
von: Ding, Yi, et al.
Veröffentlicht: (2025)
von: Ding, Yi, et al.
Veröffentlicht: (2025)
Noise-Tolerant Few-Shot Unsupervised Adapter for Vision-Language Models
von: Ali, Eman, et al.
Veröffentlicht: (2023)
von: Ali, Eman, et al.
Veröffentlicht: (2023)
Cross-Modal Adapter for Vision-Language Retrieval
von: Jiang, Haojun, et al.
Veröffentlicht: (2022)
von: Jiang, Haojun, et al.
Veröffentlicht: (2022)
VLG-CBM: Training Concept Bottleneck Models with Vision-Language Guidance
von: Srivastava, Divyansh, et al.
Veröffentlicht: (2024)
von: Srivastava, Divyansh, et al.
Veröffentlicht: (2024)
NODE-Adapter: Neural Ordinary Differential Equations for Better Vision-Language Reasoning
von: Zhang, Yi, et al.
Veröffentlicht: (2024)
von: Zhang, Yi, et al.
Veröffentlicht: (2024)
Attn-Adapter: Attention Is All You Need for Online Few-shot Learner of Vision-Language Model
von: Bui, Phuoc-Nguyen, et al.
Veröffentlicht: (2025)
von: Bui, Phuoc-Nguyen, et al.
Veröffentlicht: (2025)
Beyond CLIP Generalization: Against Forward&Backward Forgetting Adapter for Continual Learning of Vision-Language Models
von: Dong, Songlin, et al.
Veröffentlicht: (2025)
von: Dong, Songlin, et al.
Veröffentlicht: (2025)
Securing Vision-Language Models with a Robust Encoder Against Jailbreak and Adversarial Attacks
von: Hossain, Md Zarif, et al.
Veröffentlicht: (2024)
von: Hossain, Md Zarif, et al.
Veröffentlicht: (2024)
ArtGPT-4: Towards Artistic-understanding Large Vision-Language Models with Enhanced Adapter
von: Yuan, Zhengqing, et al.
Veröffentlicht: (2023)
von: Yuan, Zhengqing, et al.
Veröffentlicht: (2023)
Ähnliche Einträge
-
ReHARK: Refined Hybrid Adaptive RBF Kernels for Robust One-Shot Vision-Language Adaptation
von: Islam, Md Jahidul
Veröffentlicht: (2026) -
HeGraphAdapter: Tuning Multi-Modal Vision-Language Models with Heterogeneous Graph Adapter
von: Zhao, Yumiao, et al.
Veröffentlicht: (2024) -
W-DUALMINE: Reliability-Weighted Dual-Expert Fusion With Residual Correlation Preservation for Medical Image Fusion
von: Islam, Md. Jahidul
Veröffentlicht: (2026) -
HiRQA: Hierarchical Ranking and Quality Alignment for Opinion-Unaware Image Quality Assessment
von: Ramesh, Vaishnav, et al.
Veröffentlicht: (2025) -
DGIQA: Depth-guided Feature Attention and Refinement for Generalizable Image Quality Assessment
von: Ramesh, Vaishnav, et al.
Veröffentlicht: (2025)