:: Library Catalog

Buchumschlag

Gespeichert in:

Bibliographische Detailangaben
Hauptverfasser:	Feng, Yu, Zhou, Ben, Lin, Weidong, Roth, Dan
Format:	Preprint
Veröffentlicht:	2024
Schlagworte:	Computation and Language
Online-Zugang:	https://arxiv.org/abs/2404.12494
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Ähnliche Einträge

Conceptual and Unbiased Reasoning in Language Models
von: Zhou, Ben, et al.
Veröffentlicht: (2024)

TrustLLM: Trustworthiness in Large Language Models
von: Huang, Yue, et al.
Veröffentlicht: (2024)

FreeEval: A Modular Framework for Trustworthy and Efficient Evaluation of Large Language Models
von: Yu, Zhuohao, et al.
Veröffentlicht: (2024)

Self-supervised Analogical Learning using Language Models
von: Zhou, Ben, et al.
Veröffentlicht: (2025)

ConSiDERS-The-Human Evaluation Framework: Rethinking Human Evaluation for Generative Large Language Models
von: Elangovan, Aparna, et al.
Veröffentlicht: (2024)

SocREval: Large Language Models with the Socratic Method for Reference-Free Reasoning Evaluation
von: He, Hangfeng, et al.
Veröffentlicht: (2023)

XTRUST: On the Multilingual Trustworthiness of Large Language Models
von: Li, Yahan, et al.
Veröffentlicht: (2024)

LLM4Sweat: A Trustworthy Large Language Model for Hyperhidrosis Support
von: Lin, Wenjie, et al.
Veröffentlicht: (2025)

FamiCom: Further Demystifying Prompts for Language Models with Task-Agnostic Performance Estimation
von: Li, Bangzheng, et al.
Veröffentlicht: (2024)

A Comprehensive Survey on Trustworthiness in Reasoning with Large Language Models
von: Wang, Yanbo, et al.
Veröffentlicht: (2025)

On Reference (In-)Determinacy in Natural Language Inference
von: Chen, Sihao, et al.
Veröffentlicht: (2025)

AdaptiveLog: An Adaptive Log Analysis Framework with the Collaboration of Large and Small Language Model
von: Ma, Lipeng, et al.
Veröffentlicht: (2025)

TRUSTVIS: A Multi-Dimensional Trustworthiness Evaluation Framework for Large Language Models
von: Sun, Ruoyu, et al.
Veröffentlicht: (2025)

Investigating Numerical Translation with Large Language Models
von: Tang, Wei, et al.
Veröffentlicht: (2025)

Cross-Lingual Consistency: A Novel Inference Framework for Advancing Reasoning in Large Language Models
von: Yu, Zhiwei, et al.
Veröffentlicht: (2025)

CSV-Decode: Certifiable Sub-Vocabulary Decoding for Efficient Large Language Model Inference
von: Liu, Dong, et al.
Veröffentlicht: (2025)

BLINK: Multimodal Large Language Models Can See but Not Perceive
von: Fu, Xingyu, et al.
Veröffentlicht: (2024)

Trustworthy Alignment of Retrieval-Augmented Large Language Models via Reinforcement Learning
von: Zhang, Zongmeng, et al.
Veröffentlicht: (2024)

Aligning Large Language Models with Healthcare Stakeholders: A Pathway to Trustworthy AI Integration
von: Ding, Kexin, et al.
Veröffentlicht: (2025)

A Comprehensive Survey on the Trustworthiness of Large Language Models in Healthcare
von: Aljohani, Manar, et al.
Veröffentlicht: (2025)

ReEval: Automatic Hallucination Evaluation for Retrieval-Augmented Large Language Models via Transferable Adversarial Attacks
von: Yu, Xiaodong, et al.
Veröffentlicht: (2023)

SAISA: Towards Multimodal Large Language Models with Both Training and Inference Efficiency
von: Yuan, Qianhao, et al.
Veröffentlicht: (2025)

A Systematic Study of Training-Free Methods for Trustworthy Large Language Models
von: Si, Wai Man, et al.
Veröffentlicht: (2026)

ReFIne: A Framework for Trustworthy Large Reasoning Models with Reliability, Faithfulness, and Interpretability
von: Sun, Chung-En, et al.
Veröffentlicht: (2025)

Towards Trustworthy Retrieval Augmented Generation for Large Language Models: A Survey
von: Ni, Bo, et al.
Veröffentlicht: (2025)

FEEL: A Framework for Evaluating Emotional Support Capability with Large Language Models
von: Zhang, Huaiwen, et al.
Veröffentlicht: (2024)

Mapping Trustworthiness in Large Language Models: A Bibliometric Analysis Bridging Theory to Practice
von: de Cerqueira, José Siqueira, et al.
Veröffentlicht: (2025)

EPT Benchmark: Evaluation of Persian Trustworthiness in Large Language Models
von: Mirbagheri, Mohammad Reza, et al.
Veröffentlicht: (2025)

QSTN: A Modular Framework for Robust Questionnaire Inference with Large Language Models
von: Kreutner, Maximilian, et al.
Veröffentlicht: (2025)

BIRD: Bronze Inscription Restoration and Dating
von: Hua, Wenjie, et al.
Veröffentlicht: (2025)

FIRST: Teach A Reliable Large Language Model Through Efficient Trustworthy Distillation
von: Shum, KaShun, et al.
Veröffentlicht: (2024)

TRUE: A Trustworthy Unified Explanation Framework for Large Language Model Reasoning
von: Yang, Yujiao
Veröffentlicht: (2026)

Deceptive Semantic Shortcuts on Reasoning Chains: How Far Can Models Go without Hallucination?
von: Li, Bangzheng, et al.
Veröffentlicht: (2023)

Explainability of Large Language Models: Opportunities and Challenges toward Generating Trustworthy Explanations
von: Atakishiyev, Shahin, et al.
Veröffentlicht: (2025)

BiasFilter: An Inference-Time Debiasing Framework for Large Language Models
von: Cheng, Xiaoqing, et al.
Veröffentlicht: (2025)

TUBench: Benchmarking Large Vision-Language Models on Trustworthiness with Unanswerable Questions
von: He, Xingwei, et al.
Veröffentlicht: (2024)

A Multi-Stage Validation Framework for Trustworthy Large-scale Clinical Information Extraction using Large Language Models
von: Mahbub, Maria, et al.
Veröffentlicht: (2026)

Efficient Inference for Large Language Model-based Generative Recommendation
von: Lin, Xinyu, et al.
Veröffentlicht: (2024)

Self-Steering Optimization: Autonomous Preference Optimization for Large Language Models
von: Xiang, Hao, et al.
Veröffentlicht: (2024)

Interpretable Differential Diagnosis with Dual-Inference Large Language Models
von: Zhou, Shuang, et al.
Veröffentlicht: (2024)