Gespeichert in:
| Hauptverfasser: | Feng, Yu, Zhou, Ben, Lin, Weidong, Roth, Dan |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2024
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2404.12494 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
Conceptual and Unbiased Reasoning in Language Models
von: Zhou, Ben, et al.
Veröffentlicht: (2024)
von: Zhou, Ben, et al.
Veröffentlicht: (2024)
TrustLLM: Trustworthiness in Large Language Models
von: Huang, Yue, et al.
Veröffentlicht: (2024)
von: Huang, Yue, et al.
Veröffentlicht: (2024)
FreeEval: A Modular Framework for Trustworthy and Efficient Evaluation of Large Language Models
von: Yu, Zhuohao, et al.
Veröffentlicht: (2024)
von: Yu, Zhuohao, et al.
Veröffentlicht: (2024)
Self-supervised Analogical Learning using Language Models
von: Zhou, Ben, et al.
Veröffentlicht: (2025)
von: Zhou, Ben, et al.
Veröffentlicht: (2025)
ConSiDERS-The-Human Evaluation Framework: Rethinking Human Evaluation for Generative Large Language Models
von: Elangovan, Aparna, et al.
Veröffentlicht: (2024)
von: Elangovan, Aparna, et al.
Veröffentlicht: (2024)
SocREval: Large Language Models with the Socratic Method for Reference-Free Reasoning Evaluation
von: He, Hangfeng, et al.
Veröffentlicht: (2023)
von: He, Hangfeng, et al.
Veröffentlicht: (2023)
XTRUST: On the Multilingual Trustworthiness of Large Language Models
von: Li, Yahan, et al.
Veröffentlicht: (2024)
von: Li, Yahan, et al.
Veröffentlicht: (2024)
LLM4Sweat: A Trustworthy Large Language Model for Hyperhidrosis Support
von: Lin, Wenjie, et al.
Veröffentlicht: (2025)
von: Lin, Wenjie, et al.
Veröffentlicht: (2025)
FamiCom: Further Demystifying Prompts for Language Models with Task-Agnostic Performance Estimation
von: Li, Bangzheng, et al.
Veröffentlicht: (2024)
von: Li, Bangzheng, et al.
Veröffentlicht: (2024)
A Comprehensive Survey on Trustworthiness in Reasoning with Large Language Models
von: Wang, Yanbo, et al.
Veröffentlicht: (2025)
von: Wang, Yanbo, et al.
Veröffentlicht: (2025)
On Reference (In-)Determinacy in Natural Language Inference
von: Chen, Sihao, et al.
Veröffentlicht: (2025)
von: Chen, Sihao, et al.
Veröffentlicht: (2025)
AdaptiveLog: An Adaptive Log Analysis Framework with the Collaboration of Large and Small Language Model
von: Ma, Lipeng, et al.
Veröffentlicht: (2025)
von: Ma, Lipeng, et al.
Veröffentlicht: (2025)
TRUSTVIS: A Multi-Dimensional Trustworthiness Evaluation Framework for Large Language Models
von: Sun, Ruoyu, et al.
Veröffentlicht: (2025)
von: Sun, Ruoyu, et al.
Veröffentlicht: (2025)
Investigating Numerical Translation with Large Language Models
von: Tang, Wei, et al.
Veröffentlicht: (2025)
von: Tang, Wei, et al.
Veröffentlicht: (2025)
Cross-Lingual Consistency: A Novel Inference Framework for Advancing Reasoning in Large Language Models
von: Yu, Zhiwei, et al.
Veröffentlicht: (2025)
von: Yu, Zhiwei, et al.
Veröffentlicht: (2025)
CSV-Decode: Certifiable Sub-Vocabulary Decoding for Efficient Large Language Model Inference
von: Liu, Dong, et al.
Veröffentlicht: (2025)
von: Liu, Dong, et al.
Veröffentlicht: (2025)
BLINK: Multimodal Large Language Models Can See but Not Perceive
von: Fu, Xingyu, et al.
Veröffentlicht: (2024)
von: Fu, Xingyu, et al.
Veröffentlicht: (2024)
Trustworthy Alignment of Retrieval-Augmented Large Language Models via Reinforcement Learning
von: Zhang, Zongmeng, et al.
Veröffentlicht: (2024)
von: Zhang, Zongmeng, et al.
Veröffentlicht: (2024)
Aligning Large Language Models with Healthcare Stakeholders: A Pathway to Trustworthy AI Integration
von: Ding, Kexin, et al.
Veröffentlicht: (2025)
von: Ding, Kexin, et al.
Veröffentlicht: (2025)
A Comprehensive Survey on the Trustworthiness of Large Language Models in Healthcare
von: Aljohani, Manar, et al.
Veröffentlicht: (2025)
von: Aljohani, Manar, et al.
Veröffentlicht: (2025)
ReEval: Automatic Hallucination Evaluation for Retrieval-Augmented Large Language Models via Transferable Adversarial Attacks
von: Yu, Xiaodong, et al.
Veröffentlicht: (2023)
von: Yu, Xiaodong, et al.
Veröffentlicht: (2023)
SAISA: Towards Multimodal Large Language Models with Both Training and Inference Efficiency
von: Yuan, Qianhao, et al.
Veröffentlicht: (2025)
von: Yuan, Qianhao, et al.
Veröffentlicht: (2025)
A Systematic Study of Training-Free Methods for Trustworthy Large Language Models
von: Si, Wai Man, et al.
Veröffentlicht: (2026)
von: Si, Wai Man, et al.
Veröffentlicht: (2026)
ReFIne: A Framework for Trustworthy Large Reasoning Models with Reliability, Faithfulness, and Interpretability
von: Sun, Chung-En, et al.
Veröffentlicht: (2025)
von: Sun, Chung-En, et al.
Veröffentlicht: (2025)
Towards Trustworthy Retrieval Augmented Generation for Large Language Models: A Survey
von: Ni, Bo, et al.
Veröffentlicht: (2025)
von: Ni, Bo, et al.
Veröffentlicht: (2025)
FEEL: A Framework for Evaluating Emotional Support Capability with Large Language Models
von: Zhang, Huaiwen, et al.
Veröffentlicht: (2024)
von: Zhang, Huaiwen, et al.
Veröffentlicht: (2024)
Mapping Trustworthiness in Large Language Models: A Bibliometric Analysis Bridging Theory to Practice
von: de Cerqueira, José Siqueira, et al.
Veröffentlicht: (2025)
von: de Cerqueira, José Siqueira, et al.
Veröffentlicht: (2025)
EPT Benchmark: Evaluation of Persian Trustworthiness in Large Language Models
von: Mirbagheri, Mohammad Reza, et al.
Veröffentlicht: (2025)
von: Mirbagheri, Mohammad Reza, et al.
Veröffentlicht: (2025)
QSTN: A Modular Framework for Robust Questionnaire Inference with Large Language Models
von: Kreutner, Maximilian, et al.
Veröffentlicht: (2025)
von: Kreutner, Maximilian, et al.
Veröffentlicht: (2025)
BIRD: Bronze Inscription Restoration and Dating
von: Hua, Wenjie, et al.
Veröffentlicht: (2025)
von: Hua, Wenjie, et al.
Veröffentlicht: (2025)
FIRST: Teach A Reliable Large Language Model Through Efficient Trustworthy Distillation
von: Shum, KaShun, et al.
Veröffentlicht: (2024)
von: Shum, KaShun, et al.
Veröffentlicht: (2024)
TRUE: A Trustworthy Unified Explanation Framework for Large Language Model Reasoning
von: Yang, Yujiao
Veröffentlicht: (2026)
von: Yang, Yujiao
Veröffentlicht: (2026)
Deceptive Semantic Shortcuts on Reasoning Chains: How Far Can Models Go without Hallucination?
von: Li, Bangzheng, et al.
Veröffentlicht: (2023)
von: Li, Bangzheng, et al.
Veröffentlicht: (2023)
Explainability of Large Language Models: Opportunities and Challenges toward Generating Trustworthy Explanations
von: Atakishiyev, Shahin, et al.
Veröffentlicht: (2025)
von: Atakishiyev, Shahin, et al.
Veröffentlicht: (2025)
BiasFilter: An Inference-Time Debiasing Framework for Large Language Models
von: Cheng, Xiaoqing, et al.
Veröffentlicht: (2025)
von: Cheng, Xiaoqing, et al.
Veröffentlicht: (2025)
TUBench: Benchmarking Large Vision-Language Models on Trustworthiness with Unanswerable Questions
von: He, Xingwei, et al.
Veröffentlicht: (2024)
von: He, Xingwei, et al.
Veröffentlicht: (2024)
A Multi-Stage Validation Framework for Trustworthy Large-scale Clinical Information Extraction using Large Language Models
von: Mahbub, Maria, et al.
Veröffentlicht: (2026)
von: Mahbub, Maria, et al.
Veröffentlicht: (2026)
Efficient Inference for Large Language Model-based Generative Recommendation
von: Lin, Xinyu, et al.
Veröffentlicht: (2024)
von: Lin, Xinyu, et al.
Veröffentlicht: (2024)
Self-Steering Optimization: Autonomous Preference Optimization for Large Language Models
von: Xiang, Hao, et al.
Veröffentlicht: (2024)
von: Xiang, Hao, et al.
Veröffentlicht: (2024)
Interpretable Differential Diagnosis with Dual-Inference Large Language Models
von: Zhou, Shuang, et al.
Veröffentlicht: (2024)
von: Zhou, Shuang, et al.
Veröffentlicht: (2024)
Ähnliche Einträge
-
Conceptual and Unbiased Reasoning in Language Models
von: Zhou, Ben, et al.
Veröffentlicht: (2024) -
TrustLLM: Trustworthiness in Large Language Models
von: Huang, Yue, et al.
Veröffentlicht: (2024) -
FreeEval: A Modular Framework for Trustworthy and Efficient Evaluation of Large Language Models
von: Yu, Zhuohao, et al.
Veröffentlicht: (2024) -
Self-supervised Analogical Learning using Language Models
von: Zhou, Ben, et al.
Veröffentlicht: (2025) -
ConSiDERS-The-Human Evaluation Framework: Rethinking Human Evaluation for Generative Large Language Models
von: Elangovan, Aparna, et al.
Veröffentlicht: (2024)