:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autori principali:	Li, Haoran, Liu, Junqi, Wang, Zexian, Luo, Shiyuan, Jia, Xiaowei, Yao, Huaxiu
Natura:	Preprint
Pubblicazione:	2024
Soggetti:	Computation and Language
Accesso online:	https://arxiv.org/abs/2404.01165
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

FREE: The Foundational Semantic Recognition for Modeling Environmental Ecosystems
di: Luo, Shiyuan, et al.
Pubblicazione: (2023)

Multimodal Clinical Trial Outcome Prediction with Large Language Models
di: Zheng, Wenhao, et al.
Pubblicazione: (2024)

RULE: Reliable Multimodal RAG for Factuality in Medical Vision Language Models
di: Xia, Peng, et al.
Pubblicazione: (2024)

MMed-RAG: Versatile Multimodal RAG System for Medical Vision Language Models
di: Xia, Peng, et al.
Pubblicazione: (2024)

Ever: Mitigating Hallucination in Large Language Models through Real-Time Verification and Rectification
di: Kang, Haoqiang, et al.
Pubblicazione: (2023)

MEIT: Multimodal Electrocardiogram Instruction Tuning on Large Language Models for Report Generation
di: Wan, Zhongwei, et al.
Pubblicazione: (2024)

Verifiable Format Control for Large Language Model Generations
di: Wang, Zhaoyang, et al.
Pubblicazione: (2025)

MMedPO: Aligning Medical Vision-Language Models with Clinical-Aware Multimodal Preference Optimization
di: Zhu, Kangyu, et al.
Pubblicazione: (2024)

MMIE: Massive Multimodal Interleaved Comprehension Benchmark for Large Vision-Language Models
di: Xia, Peng, et al.
Pubblicazione: (2024)

Aligning Modalities in Vision Large Language Models via Preference Fine-tuning
di: Zhou, Yiyang, et al.
Pubblicazione: (2024)

LITE: LLM-Impelled efficient Taxonomy Evaluation
di: Zhang, Lin, et al.
Pubblicazione: (2025)

Efficient Long CoT Reasoning in Small Language Models
di: Wang, Zhaoyang, et al.
Pubblicazione: (2025)

$C^3$: Confidence Calibration Model Cascade for Inference-Efficient Cross-Lingual Natural Language Understanding
di: Lu, Taixi, et al.
Pubblicazione: (2024)

Mementos: A Comprehensive Benchmark for Multimodal Large Language Model Reasoning over Image Sequences
di: Wang, Xiyao, et al.
Pubblicazione: (2024)

FactTest: Factuality Testing in Large Language Models with Finite-Sample and Distribution-Free Guarantees
di: Nie, Fan, et al.
Pubblicazione: (2024)

Model Composition for Multimodal Large Language Models
di: Chen, Chi, et al.
Pubblicazione: (2024)

Analyzing and Mitigating Object Hallucination in Large Vision-Language Models
di: Zhou, Yiyang, et al.
Pubblicazione: (2023)

CRE-LLM: A Domain-Specific Chinese Relation Extraction Framework with Fine-tuned Large Language Model
di: Shi, Zhengpeng, et al.
Pubblicazione: (2024)

Chain-of-Action: Faithful and Multimodal Question Answering through Large Language Models
di: Pan, Zhenyu, et al.
Pubblicazione: (2024)

CITER: Collaborative Inference for Efficient Large Language Model Decoding with Token-Level Routing
di: Zheng, Wenhao, et al.
Pubblicazione: (2025)

A Comprehensive Survey of Large Language Models and Multimodal Large Language Models in Medicine
di: Xiao, Hanguang, et al.
Pubblicazione: (2024)

BACH-V: Bridging Abstract and Concrete Human-Values in Large Language Models
di: Zhang, Junyu, et al.
Pubblicazione: (2026)

RAP: Retrieval-Augmented Personalization for Multimodal Large Language Models
di: Hao, Haoran, et al.
Pubblicazione: (2024)

To Preserve or To Compress: An In-Depth Study of Connector Selection in Multimodal Large Language Models
di: Lin, Junyan, et al.
Pubblicazione: (2024)

Exploring the Role of Explicit Temporal Modeling in Multimodal Large Language Models for Video Understanding
di: Li, Yun, et al.
Pubblicazione: (2025)

Jailbreaking Large Language Models with Morality Attacks
di: Su, Ying, et al.
Pubblicazione: (2026)

CREAM: Consistency Regularized Self-Rewarding Language Models
di: Wang, Zhaoyang, et al.
Pubblicazione: (2024)

MMEvol: Empowering Multimodal Large Language Models with Evol-Instruct
di: Luo, Run, et al.
Pubblicazione: (2024)

A Survey on Agentic Multimodal Large Language Models
di: Yao, Huanjin, et al.
Pubblicazione: (2025)

Ovis: Structural Embedding Alignment for Multimodal Large Language Model
di: Lu, Shiyin, et al.
Pubblicazione: (2024)

Evaluating Large Language Models on Multimodal Chemistry Olympiad Exams
di: Cui, Yiming, et al.
Pubblicazione: (2025)

STORM: Internalized Modeling for Spatial-Temporal Reasoning in Video-Language Models
di: Liang, Yiming, et al.
Pubblicazione: (2026)

Enhancing Visual-Language Modality Alignment in Large Vision Language Models via Self-Improvement
di: Wang, Xiyao, et al.
Pubblicazione: (2024)

SimpleVQA: Multimodal Factuality Evaluation for Multimodal Large Language Models
di: Cheng, Xianfu, et al.
Pubblicazione: (2025)

Fine-Grained Verifiers: Preference Modeling as Next-token Prediction in Vision-Language Alignment
di: Cui, Chenhang, et al.
Pubblicazione: (2024)

CODIS: Benchmarking Context-Dependent Visual Comprehension for Multimodal Large Language Models
di: Luo, Fuwen, et al.
Pubblicazione: (2024)

Towards Trustable Language Models: Investigating Information Quality of Large Language Models
di: Rejeleene, Rick, et al.
Pubblicazione: (2024)

Do LLMs Know What Is Private Internally? Probing and Steering Contextual Privacy Norms in Large Language Model Representations
di: Wang, Haoran, et al.
Pubblicazione: (2026)

Calibrated Self-Rewarding Vision Language Models
di: Zhou, Yiyang, et al.
Pubblicazione: (2024)

Trust-Oriented Adaptive Guardrails for Large Language Models
di: Hu, Jinwei, et al.
Pubblicazione: (2024)