Salvato in:
| Autori principali: | Li, Haoran, Liu, Junqi, Wang, Zexian, Luo, Shiyuan, Jia, Xiaowei, Yao, Huaxiu |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2024
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2404.01165 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
FREE: The Foundational Semantic Recognition for Modeling Environmental Ecosystems
di: Luo, Shiyuan, et al.
Pubblicazione: (2023)
di: Luo, Shiyuan, et al.
Pubblicazione: (2023)
Multimodal Clinical Trial Outcome Prediction with Large Language Models
di: Zheng, Wenhao, et al.
Pubblicazione: (2024)
di: Zheng, Wenhao, et al.
Pubblicazione: (2024)
RULE: Reliable Multimodal RAG for Factuality in Medical Vision Language Models
di: Xia, Peng, et al.
Pubblicazione: (2024)
di: Xia, Peng, et al.
Pubblicazione: (2024)
MMed-RAG: Versatile Multimodal RAG System for Medical Vision Language Models
di: Xia, Peng, et al.
Pubblicazione: (2024)
di: Xia, Peng, et al.
Pubblicazione: (2024)
Ever: Mitigating Hallucination in Large Language Models through Real-Time Verification and Rectification
di: Kang, Haoqiang, et al.
Pubblicazione: (2023)
di: Kang, Haoqiang, et al.
Pubblicazione: (2023)
MEIT: Multimodal Electrocardiogram Instruction Tuning on Large Language Models for Report Generation
di: Wan, Zhongwei, et al.
Pubblicazione: (2024)
di: Wan, Zhongwei, et al.
Pubblicazione: (2024)
Verifiable Format Control for Large Language Model Generations
di: Wang, Zhaoyang, et al.
Pubblicazione: (2025)
di: Wang, Zhaoyang, et al.
Pubblicazione: (2025)
MMedPO: Aligning Medical Vision-Language Models with Clinical-Aware Multimodal Preference Optimization
di: Zhu, Kangyu, et al.
Pubblicazione: (2024)
di: Zhu, Kangyu, et al.
Pubblicazione: (2024)
MMIE: Massive Multimodal Interleaved Comprehension Benchmark for Large Vision-Language Models
di: Xia, Peng, et al.
Pubblicazione: (2024)
di: Xia, Peng, et al.
Pubblicazione: (2024)
Aligning Modalities in Vision Large Language Models via Preference Fine-tuning
di: Zhou, Yiyang, et al.
Pubblicazione: (2024)
di: Zhou, Yiyang, et al.
Pubblicazione: (2024)
LITE: LLM-Impelled efficient Taxonomy Evaluation
di: Zhang, Lin, et al.
Pubblicazione: (2025)
di: Zhang, Lin, et al.
Pubblicazione: (2025)
Efficient Long CoT Reasoning in Small Language Models
di: Wang, Zhaoyang, et al.
Pubblicazione: (2025)
di: Wang, Zhaoyang, et al.
Pubblicazione: (2025)
$C^3$: Confidence Calibration Model Cascade for Inference-Efficient Cross-Lingual Natural Language Understanding
di: Lu, Taixi, et al.
Pubblicazione: (2024)
di: Lu, Taixi, et al.
Pubblicazione: (2024)
Mementos: A Comprehensive Benchmark for Multimodal Large Language Model Reasoning over Image Sequences
di: Wang, Xiyao, et al.
Pubblicazione: (2024)
di: Wang, Xiyao, et al.
Pubblicazione: (2024)
FactTest: Factuality Testing in Large Language Models with Finite-Sample and Distribution-Free Guarantees
di: Nie, Fan, et al.
Pubblicazione: (2024)
di: Nie, Fan, et al.
Pubblicazione: (2024)
Model Composition for Multimodal Large Language Models
di: Chen, Chi, et al.
Pubblicazione: (2024)
di: Chen, Chi, et al.
Pubblicazione: (2024)
Analyzing and Mitigating Object Hallucination in Large Vision-Language Models
di: Zhou, Yiyang, et al.
Pubblicazione: (2023)
di: Zhou, Yiyang, et al.
Pubblicazione: (2023)
CRE-LLM: A Domain-Specific Chinese Relation Extraction Framework with Fine-tuned Large Language Model
di: Shi, Zhengpeng, et al.
Pubblicazione: (2024)
di: Shi, Zhengpeng, et al.
Pubblicazione: (2024)
Chain-of-Action: Faithful and Multimodal Question Answering through Large Language Models
di: Pan, Zhenyu, et al.
Pubblicazione: (2024)
di: Pan, Zhenyu, et al.
Pubblicazione: (2024)
CITER: Collaborative Inference for Efficient Large Language Model Decoding with Token-Level Routing
di: Zheng, Wenhao, et al.
Pubblicazione: (2025)
di: Zheng, Wenhao, et al.
Pubblicazione: (2025)
A Comprehensive Survey of Large Language Models and Multimodal Large Language Models in Medicine
di: Xiao, Hanguang, et al.
Pubblicazione: (2024)
di: Xiao, Hanguang, et al.
Pubblicazione: (2024)
BACH-V: Bridging Abstract and Concrete Human-Values in Large Language Models
di: Zhang, Junyu, et al.
Pubblicazione: (2026)
di: Zhang, Junyu, et al.
Pubblicazione: (2026)
RAP: Retrieval-Augmented Personalization for Multimodal Large Language Models
di: Hao, Haoran, et al.
Pubblicazione: (2024)
di: Hao, Haoran, et al.
Pubblicazione: (2024)
To Preserve or To Compress: An In-Depth Study of Connector Selection in Multimodal Large Language Models
di: Lin, Junyan, et al.
Pubblicazione: (2024)
di: Lin, Junyan, et al.
Pubblicazione: (2024)
Exploring the Role of Explicit Temporal Modeling in Multimodal Large Language Models for Video Understanding
di: Li, Yun, et al.
Pubblicazione: (2025)
di: Li, Yun, et al.
Pubblicazione: (2025)
Jailbreaking Large Language Models with Morality Attacks
di: Su, Ying, et al.
Pubblicazione: (2026)
di: Su, Ying, et al.
Pubblicazione: (2026)
CREAM: Consistency Regularized Self-Rewarding Language Models
di: Wang, Zhaoyang, et al.
Pubblicazione: (2024)
di: Wang, Zhaoyang, et al.
Pubblicazione: (2024)
MMEvol: Empowering Multimodal Large Language Models with Evol-Instruct
di: Luo, Run, et al.
Pubblicazione: (2024)
di: Luo, Run, et al.
Pubblicazione: (2024)
A Survey on Agentic Multimodal Large Language Models
di: Yao, Huanjin, et al.
Pubblicazione: (2025)
di: Yao, Huanjin, et al.
Pubblicazione: (2025)
Ovis: Structural Embedding Alignment for Multimodal Large Language Model
di: Lu, Shiyin, et al.
Pubblicazione: (2024)
di: Lu, Shiyin, et al.
Pubblicazione: (2024)
Evaluating Large Language Models on Multimodal Chemistry Olympiad Exams
di: Cui, Yiming, et al.
Pubblicazione: (2025)
di: Cui, Yiming, et al.
Pubblicazione: (2025)
STORM: Internalized Modeling for Spatial-Temporal Reasoning in Video-Language Models
di: Liang, Yiming, et al.
Pubblicazione: (2026)
di: Liang, Yiming, et al.
Pubblicazione: (2026)
Enhancing Visual-Language Modality Alignment in Large Vision Language Models via Self-Improvement
di: Wang, Xiyao, et al.
Pubblicazione: (2024)
di: Wang, Xiyao, et al.
Pubblicazione: (2024)
SimpleVQA: Multimodal Factuality Evaluation for Multimodal Large Language Models
di: Cheng, Xianfu, et al.
Pubblicazione: (2025)
di: Cheng, Xianfu, et al.
Pubblicazione: (2025)
Fine-Grained Verifiers: Preference Modeling as Next-token Prediction in Vision-Language Alignment
di: Cui, Chenhang, et al.
Pubblicazione: (2024)
di: Cui, Chenhang, et al.
Pubblicazione: (2024)
CODIS: Benchmarking Context-Dependent Visual Comprehension for Multimodal Large Language Models
di: Luo, Fuwen, et al.
Pubblicazione: (2024)
di: Luo, Fuwen, et al.
Pubblicazione: (2024)
Towards Trustable Language Models: Investigating Information Quality of Large Language Models
di: Rejeleene, Rick, et al.
Pubblicazione: (2024)
di: Rejeleene, Rick, et al.
Pubblicazione: (2024)
Do LLMs Know What Is Private Internally? Probing and Steering Contextual Privacy Norms in Large Language Model Representations
di: Wang, Haoran, et al.
Pubblicazione: (2026)
di: Wang, Haoran, et al.
Pubblicazione: (2026)
Calibrated Self-Rewarding Vision Language Models
di: Zhou, Yiyang, et al.
Pubblicazione: (2024)
di: Zhou, Yiyang, et al.
Pubblicazione: (2024)
Trust-Oriented Adaptive Guardrails for Large Language Models
di: Hu, Jinwei, et al.
Pubblicazione: (2024)
di: Hu, Jinwei, et al.
Pubblicazione: (2024)
Documenti analoghi
-
FREE: The Foundational Semantic Recognition for Modeling Environmental Ecosystems
di: Luo, Shiyuan, et al.
Pubblicazione: (2023) -
Multimodal Clinical Trial Outcome Prediction with Large Language Models
di: Zheng, Wenhao, et al.
Pubblicazione: (2024) -
RULE: Reliable Multimodal RAG for Factuality in Medical Vision Language Models
di: Xia, Peng, et al.
Pubblicazione: (2024) -
MMed-RAG: Versatile Multimodal RAG System for Medical Vision Language Models
di: Xia, Peng, et al.
Pubblicazione: (2024) -
Ever: Mitigating Hallucination in Large Language Models through Real-Time Verification and Rectification
di: Kang, Haoqiang, et al.
Pubblicazione: (2023)