:: Library Catalog

Image de couverture de livre

Enregistré dans:

Détails bibliographiques
Auteurs principaux:	Yu, Kang, Wang, Dingyu, Yuan, Zimu, Zhou, Nan, Liu, Jiajun, Liu, Jiaxin, Liu, Shanggui, Zheng, Yaoyan, Yuan, Huishu, Huang, Di, Jiang, Dong
Format:	Preprint
Publié:	2026
Sujets:	Computer Vision and Pattern Recognition Artificial Intelligence
Accès en ligne:	https://arxiv.org/abs/2601.18250
Tags:	Ajouter un tag Pas de tags, Soyez le premier à ajouter un tag!

Documents similaires

The Illusion of Clinical Reasoning: A Benchmark Reveals the Pervasive Gap in Vision-Language Models for Clinical Competency
par: Wang, Dingyu, et autres
Publié: (2025)

OrthoDiffusion: A Generalizable Multi-Task Diffusion Foundation Model for Musculoskeletal MRI Interpretation
par: Lan, Tian, et autres
Publié: (2026)

A multi-modal vision-language model for generalizable annotation-free pathology localization
par: Yang, Hao, et autres
Publié: (2024)

Implicit Modeling for Transferability Estimation of Vision Foundation Models
par: Zheng, Yaoyan, et autres
Publié: (2025)

CoVFT: Context-aware Visual Fine-tuning for Multimodal Large Language Models
par: Zhou, Nan, et autres
Publié: (2026)

Crowd-SAM: SAM as a Smart Annotator for Object Detection in Crowded Scenes
par: Cai, Zhi, et autres
Publié: (2024)

Generative vector search to improve pathology foundation models across multimodal vision-language tasks
par: Ekvall, Markus, et autres
Publié: (2025)

Deep Common Feature Mining for Efficient Video Semantic Segmentation
par: Zheng, Yaoyan, et autres
Publié: (2024)

Quantized-Tinyllava: a new multimodal foundation model enables efficient split learning
par: Guo, Jiajun, et autres
Publié: (2025)

Clinical Diagnostic Value of 5 T MRI for Knee Injuries: A Comparison Study With 1.5 or 3 T
par: Suwei Liu, et autres
Publié: (2025)

Affiliating With Jury: Analysis of Multimodal Graduation in Attorneys’ Closing Arguments
par: Huishu Cao, et autres
Publié: (2024)

Time‐ and dose‐related pathological changes in knee osteoarthritis rat model induced by monosodium iodoacetate
par: Wei Pu, et autres
Publié: (2025)

PAST: A multimodal single-cell foundation model for histopathology and spatial transcriptomics in cancer
par: Yang, Changchun, et autres
Publié: (2025)

A generalizable large-scale foundation model for musculoskeletal radiographs
par: Kim, Shinn, et autres
Publié: (2026)

UCell: rethinking generalizability and scaling of bio-medical vision models
par: Kuang, Nicholas, et autres
Publié: (2026)

Curriculum-guided multimodal representation learning enables generalizable prediction of nanomaterial-protein interactions
par: Yu, Hengjie, et autres
Publié: (2025)

A generalizable foundation model for intraoperative understanding across surgical procedures
par: Park, Kanggil, et autres
Publié: (2026)

Participant Discomfort During 5 T MRI Examinations and Its Contributing Factors
par: Suwei Liu, et autres
Publié: (2025)

A foundation model for generalizable disease diagnosis in chest X-ray images
par: Xu, Lijian, et autres
Publié: (2024)

YOLOv10 with Kolmogorov-Arnold networks and vision-language foundation models for interpretable object detection and trustworthy multimodal AI in computer vision perception
par: Impraimakis, Marios, et autres
Publié: (2026)

Enhancing the vision-language foundation model with key semantic knowledge-emphasized report refinement
par: Huang, Weijian, et autres
Publié: (2024)

A generalizable framework for low-rank tensor completion with numerical priors
par: Yuan, Shiran, et autres
Publié: (2023)

Physics-guided foundation model for universal speckle removal in ultrathin multimode fiber imaging
par: Zeng, Xianrui, et autres
Publié: (2026)

VISTA-PATH: An interactive foundation model for pathology image segmentation and quantitative analysis in computational pathology
par: Liang, Peixian, et autres
Publié: (2026)

A Multimodal Fusion and Deep Learning‐Based Behaviour Recognition Model for Assessing Executive Function in Young Children
par: Teng Xie, et autres
Publié: (2026)

iVPT: Improving Task-relevant Information Sharing in Visual Prompt Tuning by Cross-layer Dynamic Connection
par: Zhou, Nan, et autres
Publié: (2024)

SS-DPPN: A self-supervised dual-path foundation model for the generalizable cardiac audio representation
par: Muna, Ummy Maria, et autres
Publié: (2025)

EchoPFL: Asynchronous Personalized Federated Learning on Mobile Devices with On-Demand Staleness Control
par: Li, Xiaochen, et autres
Publié: (2024)

A generalizable framework for unlocking missing reactions in genome-scale metabolic networks using deep learning
par: Liu, Xiaoyi, et autres
Publié: (2024)

Pharmacometrics-Enabled DOse OPtimization (PEDOOP) for Seamless Phase I-II Trials in Oncology
par: Yuan, Shijie, et autres
Publié: (2023)

Distilling foundation models for robust and efficient models in digital pathology
par: Filiot, Alexandre, et autres
Publié: (2025)

Tissue Concepts: supervised foundation models in computational pathology
par: Nicke, Till, et autres
Publié: (2024)

Streamline pathology foundation model by cross-magnification distillation
par: Su, Ziyu, et autres
Publié: (2025)

Enabling clinical use of foundation models for computational pathology
par: Henriksen, Audun L, et autres
Publié: (2026)

Fine-tuning vision foundation model for crack segmentation in civil infrastructures
par: Ge, Kang, et autres
Publié: (2023)

FoMo4Wheat: Toward reliable crop vision foundation models with globally curated data
par: Han, Bing, et autres
Publié: (2025)

nnMIL: A generalizable multiple instance learning framework for computational pathology
par: Luo, Xiangde, et autres
Publié: (2025)

A benchmark multimodal oro-dental dataset for large vision-language models
par: Lv, Haoxin, et autres
Publié: (2025)

EXACT: an explainable anomaly-aware vision foundation model for analysis of 3D chest CT
par: Bai, Xuguang, et autres
Publié: (2026)

Towards channel foundation models (CFMs): Motivations, methodologies and opportunities
par: Jiang, Jun, et autres
Publié: (2025)