Enregistré dans:
| Auteurs principaux: | Yu, Kang, Wang, Dingyu, Yuan, Zimu, Zhou, Nan, Liu, Jiajun, Liu, Jiaxin, Liu, Shanggui, Zheng, Yaoyan, Yuan, Huishu, Huang, Di, Jiang, Dong |
|---|---|
| Format: | Preprint |
| Publié: |
2026
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2601.18250 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
The Illusion of Clinical Reasoning: A Benchmark Reveals the Pervasive Gap in Vision-Language Models for Clinical Competency
par: Wang, Dingyu, et autres
Publié: (2025)
par: Wang, Dingyu, et autres
Publié: (2025)
OrthoDiffusion: A Generalizable Multi-Task Diffusion Foundation Model for Musculoskeletal MRI Interpretation
par: Lan, Tian, et autres
Publié: (2026)
par: Lan, Tian, et autres
Publié: (2026)
A multi-modal vision-language model for generalizable annotation-free pathology localization
par: Yang, Hao, et autres
Publié: (2024)
par: Yang, Hao, et autres
Publié: (2024)
Implicit Modeling for Transferability Estimation of Vision Foundation Models
par: Zheng, Yaoyan, et autres
Publié: (2025)
par: Zheng, Yaoyan, et autres
Publié: (2025)
CoVFT: Context-aware Visual Fine-tuning for Multimodal Large Language Models
par: Zhou, Nan, et autres
Publié: (2026)
par: Zhou, Nan, et autres
Publié: (2026)
Crowd-SAM: SAM as a Smart Annotator for Object Detection in Crowded Scenes
par: Cai, Zhi, et autres
Publié: (2024)
par: Cai, Zhi, et autres
Publié: (2024)
Generative vector search to improve pathology foundation models across multimodal vision-language tasks
par: Ekvall, Markus, et autres
Publié: (2025)
par: Ekvall, Markus, et autres
Publié: (2025)
Deep Common Feature Mining for Efficient Video Semantic Segmentation
par: Zheng, Yaoyan, et autres
Publié: (2024)
par: Zheng, Yaoyan, et autres
Publié: (2024)
Quantized-Tinyllava: a new multimodal foundation model enables efficient split learning
par: Guo, Jiajun, et autres
Publié: (2025)
par: Guo, Jiajun, et autres
Publié: (2025)
Clinical Diagnostic Value of 5 T MRI for Knee Injuries: A Comparison Study With 1.5 or 3 T
par: Suwei Liu, et autres
Publié: (2025)
par: Suwei Liu, et autres
Publié: (2025)
Affiliating With Jury: Analysis of Multimodal Graduation in Attorneys’ Closing Arguments
par: Huishu Cao, et autres
Publié: (2024)
par: Huishu Cao, et autres
Publié: (2024)
Time‐ and dose‐related pathological changes in knee osteoarthritis rat model induced by monosodium iodoacetate
par: Wei Pu, et autres
Publié: (2025)
par: Wei Pu, et autres
Publié: (2025)
PAST: A multimodal single-cell foundation model for histopathology and spatial transcriptomics in cancer
par: Yang, Changchun, et autres
Publié: (2025)
par: Yang, Changchun, et autres
Publié: (2025)
A generalizable large-scale foundation model for musculoskeletal radiographs
par: Kim, Shinn, et autres
Publié: (2026)
par: Kim, Shinn, et autres
Publié: (2026)
UCell: rethinking generalizability and scaling of bio-medical vision models
par: Kuang, Nicholas, et autres
Publié: (2026)
par: Kuang, Nicholas, et autres
Publié: (2026)
Curriculum-guided multimodal representation learning enables generalizable prediction of nanomaterial-protein interactions
par: Yu, Hengjie, et autres
Publié: (2025)
par: Yu, Hengjie, et autres
Publié: (2025)
A generalizable foundation model for intraoperative understanding across surgical procedures
par: Park, Kanggil, et autres
Publié: (2026)
par: Park, Kanggil, et autres
Publié: (2026)
Participant Discomfort During 5 T MRI Examinations and Its Contributing Factors
par: Suwei Liu, et autres
Publié: (2025)
par: Suwei Liu, et autres
Publié: (2025)
A foundation model for generalizable disease diagnosis in chest X-ray images
par: Xu, Lijian, et autres
Publié: (2024)
par: Xu, Lijian, et autres
Publié: (2024)
YOLOv10 with Kolmogorov-Arnold networks and vision-language foundation models for interpretable object detection and trustworthy multimodal AI in computer vision perception
par: Impraimakis, Marios, et autres
Publié: (2026)
par: Impraimakis, Marios, et autres
Publié: (2026)
Enhancing the vision-language foundation model with key semantic knowledge-emphasized report refinement
par: Huang, Weijian, et autres
Publié: (2024)
par: Huang, Weijian, et autres
Publié: (2024)
A generalizable framework for low-rank tensor completion with numerical priors
par: Yuan, Shiran, et autres
Publié: (2023)
par: Yuan, Shiran, et autres
Publié: (2023)
Physics-guided foundation model for universal speckle removal in ultrathin multimode fiber imaging
par: Zeng, Xianrui, et autres
Publié: (2026)
par: Zeng, Xianrui, et autres
Publié: (2026)
VISTA-PATH: An interactive foundation model for pathology image segmentation and quantitative analysis in computational pathology
par: Liang, Peixian, et autres
Publié: (2026)
par: Liang, Peixian, et autres
Publié: (2026)
A Multimodal Fusion and Deep Learning‐Based Behaviour Recognition Model for Assessing Executive Function in Young Children
par: Teng Xie, et autres
Publié: (2026)
par: Teng Xie, et autres
Publié: (2026)
iVPT: Improving Task-relevant Information Sharing in Visual Prompt Tuning by Cross-layer Dynamic Connection
par: Zhou, Nan, et autres
Publié: (2024)
par: Zhou, Nan, et autres
Publié: (2024)
SS-DPPN: A self-supervised dual-path foundation model for the generalizable cardiac audio representation
par: Muna, Ummy Maria, et autres
Publié: (2025)
par: Muna, Ummy Maria, et autres
Publié: (2025)
EchoPFL: Asynchronous Personalized Federated Learning on Mobile Devices with On-Demand Staleness Control
par: Li, Xiaochen, et autres
Publié: (2024)
par: Li, Xiaochen, et autres
Publié: (2024)
A generalizable framework for unlocking missing reactions in genome-scale metabolic networks using deep learning
par: Liu, Xiaoyi, et autres
Publié: (2024)
par: Liu, Xiaoyi, et autres
Publié: (2024)
Pharmacometrics-Enabled DOse OPtimization (PEDOOP) for Seamless Phase I-II Trials in Oncology
par: Yuan, Shijie, et autres
Publié: (2023)
par: Yuan, Shijie, et autres
Publié: (2023)
Distilling foundation models for robust and efficient models in digital pathology
par: Filiot, Alexandre, et autres
Publié: (2025)
par: Filiot, Alexandre, et autres
Publié: (2025)
Tissue Concepts: supervised foundation models in computational pathology
par: Nicke, Till, et autres
Publié: (2024)
par: Nicke, Till, et autres
Publié: (2024)
Streamline pathology foundation model by cross-magnification distillation
par: Su, Ziyu, et autres
Publié: (2025)
par: Su, Ziyu, et autres
Publié: (2025)
Enabling clinical use of foundation models for computational pathology
par: Henriksen, Audun L, et autres
Publié: (2026)
par: Henriksen, Audun L, et autres
Publié: (2026)
Fine-tuning vision foundation model for crack segmentation in civil infrastructures
par: Ge, Kang, et autres
Publié: (2023)
par: Ge, Kang, et autres
Publié: (2023)
FoMo4Wheat: Toward reliable crop vision foundation models with globally curated data
par: Han, Bing, et autres
Publié: (2025)
par: Han, Bing, et autres
Publié: (2025)
nnMIL: A generalizable multiple instance learning framework for computational pathology
par: Luo, Xiangde, et autres
Publié: (2025)
par: Luo, Xiangde, et autres
Publié: (2025)
A benchmark multimodal oro-dental dataset for large vision-language models
par: Lv, Haoxin, et autres
Publié: (2025)
par: Lv, Haoxin, et autres
Publié: (2025)
EXACT: an explainable anomaly-aware vision foundation model for analysis of 3D chest CT
par: Bai, Xuguang, et autres
Publié: (2026)
par: Bai, Xuguang, et autres
Publié: (2026)
Towards channel foundation models (CFMs): Motivations, methodologies and opportunities
par: Jiang, Jun, et autres
Publié: (2025)
par: Jiang, Jun, et autres
Publié: (2025)
Documents similaires
-
The Illusion of Clinical Reasoning: A Benchmark Reveals the Pervasive Gap in Vision-Language Models for Clinical Competency
par: Wang, Dingyu, et autres
Publié: (2025) -
OrthoDiffusion: A Generalizable Multi-Task Diffusion Foundation Model for Musculoskeletal MRI Interpretation
par: Lan, Tian, et autres
Publié: (2026) -
A multi-modal vision-language model for generalizable annotation-free pathology localization
par: Yang, Hao, et autres
Publié: (2024) -
Implicit Modeling for Transferability Estimation of Vision Foundation Models
par: Zheng, Yaoyan, et autres
Publié: (2025) -
CoVFT: Context-aware Visual Fine-tuning for Multimodal Large Language Models
par: Zhou, Nan, et autres
Publié: (2026)