:: Library Catalog

Buchumschlag

Gespeichert in:

Bibliographische Detailangaben
1. Verfasser:	Islam, Md Jahidul
Format:	Preprint
Veröffentlicht:	2026
Schlagworte:	Computer Vision and Pattern Recognition
Online-Zugang:	https://arxiv.org/abs/2603.16653
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Ähnliche Einträge

ReHARK: Refined Hybrid Adaptive RBF Kernels for Robust One-Shot Vision-Language Adaptation
von: Islam, Md Jahidul
Veröffentlicht: (2026)

HeGraphAdapter: Tuning Multi-Modal Vision-Language Models with Heterogeneous Graph Adapter
von: Zhao, Yumiao, et al.
Veröffentlicht: (2024)

W-DUALMINE: Reliability-Weighted Dual-Expert Fusion With Residual Correlation Preservation for Medical Image Fusion
von: Islam, Md. Jahidul
Veröffentlicht: (2026)

HiRQA: Hierarchical Ranking and Quality Alignment for Opinion-Unaware Image Quality Assessment
von: Ramesh, Vaishnav, et al.
Veröffentlicht: (2025)

DGIQA: Depth-guided Feature Attention and Refinement for Generalizable Image Quality Assessment
von: Ramesh, Vaishnav, et al.
Veröffentlicht: (2025)

Robust Calibration of Large Vision-Language Adapters
von: Murugesan, Balamurali, et al.
Veröffentlicht: (2024)

AquaFuse: Waterbody Fusion for Physics Guided View Synthesis of Underwater Scenes
von: Siddique, Md Abu Bakr, et al.
Veröffentlicht: (2024)

CLIP-Adapter: Better Vision-Language Models with Feature Adapters
von: Gao, Peng, et al.
Veröffentlicht: (2021)

T-Gated Adapter: A Lightweight Temporal Adapter for Vision-Language Medical Segmentation
von: Khadka, Pranjal
Veröffentlicht: (2026)

Test-time Alignment-Enhanced Adapter for Vision-Language Models
von: Tong, Baoshun, et al.
Veröffentlicht: (2024)

Isolated Bangla Handwritten Character Classification using Transfer Learning
von: Karim, Abdul, et al.
Veröffentlicht: (2025)

Improving Concept Alignment in Vision-Language Concept Bottleneck Models
von: Selvaraj, Nithish Muthuchamy, et al.
Veröffentlicht: (2024)

UStyle: Waterbody Style Transfer of Underwater Scenes by Depth-Guided Feature Synthesis
von: Siddique, Md Abu Bakr, et al.
Veröffentlicht: (2025)

IKIWISI: An Interactive Visual Pattern Generator for Evaluating the Reliability of Vision-Language Models Without Ground Truth
von: Islam, Md Touhidul, et al.
Veröffentlicht: (2025)

Vision-Language Models for Automated Chest X-ray Interpretation: Leveraging ViT and GPT-2
von: Islam, Md. Rakibul, et al.
Veröffentlicht: (2025)

Meta-Adapter: An Online Few-shot Learner for Vision-Language Model
von: Cheng, Cheng, et al.
Veröffentlicht: (2023)

Single-Step Latent Diffusion for Underwater Image Restoration
von: Wu, Jiayi, et al.
Veröffentlicht: (2025)

ReVisionLLM: Recursive Vision-Language Model for Temporal Grounding in Hour-Long Videos
von: Hannan, Tanveer, et al.
Veröffentlicht: (2024)

Boosting Continual Learning of Vision-Language Models via Mixture-of-Experts Adapters
von: Yu, Jiazuo, et al.
Veröffentlicht: (2024)

A Robust Deep Learning Framework for Bangla License Plate Recognition Using YOLO and Vision-Language OCR
von: Hasin, Nayeb, et al.
Veröffentlicht: (2026)

Few-Shot-Based Modular Image-to-Video Adapter for Diffusion Models
von: Li, Zhenhao, et al.
Veröffentlicht: (2025)

An Explainable Vision-Language Model Framework with Adaptive PID-Tversky Loss for Lumbar Spinal Stenosis Diagnosis
von: Sk., Md. Sajeebul Islam, et al.
Veröffentlicht: (2026)

Mema: Memory-Augmented Adapter for Enhanced Vision-Language Understanding
von: Liu, Ying, et al.
Veröffentlicht: (2026)

Multi-Modal Adapter for Vision-Language Models
von: Seputis, Dominykas, et al.
Veröffentlicht: (2024)

DIMoE-Adapters: Dynamic Expert Evolution for Continual Learning in Vision-Language Models
von: Qin, Mengxin, et al.
Veröffentlicht: (2026)

Skip Tuning: Pre-trained Vision-Language Models are Effective and Efficient Adapters Themselves
von: Wu, Shihan, et al.
Veröffentlicht: (2024)

QueryAdapter: Rapid Adaptation of Vision-Language Models in Response to Natural Language Queries
von: Chapman, Nicolas Harvey, et al.
Veröffentlicht: (2025)

Unveiling the Visual Counting Bottleneck in Vision-Language Models
von: Pang, Xingzhou, et al.
Veröffentlicht: (2026)

TAB: Transformer Attention Bottlenecks enable User Intervention and Debugging in Vision-Language Models
von: Rahmanzadehgervi, Pooyan, et al.
Veröffentlicht: (2024)

A Two-Stage Multitask Vision-Language Framework for Explainable Crop Disease Visual Question Answering
von: Hossain, Md. Zahid, et al.
Veröffentlicht: (2026)

Diagnosing Bottlenecks in Data Visualization Understanding by Vision-Language Models
von: Tartaglini, Alexa R., et al.
Veröffentlicht: (2025)

Rethinking Bottlenecks in Safety Fine-Tuning of Vision Language Models
von: Ding, Yi, et al.
Veröffentlicht: (2025)

Noise-Tolerant Few-Shot Unsupervised Adapter for Vision-Language Models
von: Ali, Eman, et al.
Veröffentlicht: (2023)

Cross-Modal Adapter for Vision-Language Retrieval
von: Jiang, Haojun, et al.
Veröffentlicht: (2022)

VLG-CBM: Training Concept Bottleneck Models with Vision-Language Guidance
von: Srivastava, Divyansh, et al.
Veröffentlicht: (2024)

NODE-Adapter: Neural Ordinary Differential Equations for Better Vision-Language Reasoning
von: Zhang, Yi, et al.
Veröffentlicht: (2024)

Attn-Adapter: Attention Is All You Need for Online Few-shot Learner of Vision-Language Model
von: Bui, Phuoc-Nguyen, et al.
Veröffentlicht: (2025)

Beyond CLIP Generalization: Against Forward&Backward Forgetting Adapter for Continual Learning of Vision-Language Models
von: Dong, Songlin, et al.
Veröffentlicht: (2025)

Securing Vision-Language Models with a Robust Encoder Against Jailbreak and Adversarial Attacks
von: Hossain, Md Zarif, et al.
Veröffentlicht: (2024)

ArtGPT-4: Towards Artistic-understanding Large Vision-Language Models with Enhanced Adapter
von: Yuan, Zhengqing, et al.
Veröffentlicht: (2023)