Gespeichert in:
| 1. Verfasser: | Mehta, Deep |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2026
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2601.06423 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
Verbosity Tradeoffs and the Impact of Scale on the Faithfulness of LLM Self-Explanations
von: Siegel, Noah Y., et al.
Veröffentlicht: (2025)
von: Siegel, Noah Y., et al.
Veröffentlicht: (2025)
Can We Trust AI Explanations? Evidence of Systematic Underreporting in Chain-of-Thought Reasoning
von: Mehta, Deep Pankajbhai
Veröffentlicht: (2025)
von: Mehta, Deep Pankajbhai
Veröffentlicht: (2025)
When Does Multi-Agent RL Improve LLM Workflows? Workflow, Scale, and Policy-Sharing Tradeoffs
von: Zeng, Yifan, et al.
Veröffentlicht: (2026)
von: Zeng, Yifan, et al.
Veröffentlicht: (2026)
CanaryBench: Stress Testing Privacy Leakage in Cluster-Level Conversation Summaries
von: Mehta, Deep
Veröffentlicht: (2026)
von: Mehta, Deep
Veröffentlicht: (2026)
Improving Faithfulness of Large Language Models in Summarization via Sliding Generation and Self-Consistency
von: Li, Taiji, et al.
Veröffentlicht: (2024)
von: Li, Taiji, et al.
Veröffentlicht: (2024)
Placement Semantics for Distributed Deep Learning: A Systematic Framework for Analyzing Parallelism Strategies
von: Mehta, Deep Pankajbhai
Veröffentlicht: (2026)
von: Mehta, Deep Pankajbhai
Veröffentlicht: (2026)
FloCA: Towards Faithful and Logically Consistent Flowchart Reasoning
von: Zou, Jinzi, et al.
Veröffentlicht: (2026)
von: Zou, Jinzi, et al.
Veröffentlicht: (2026)
Scaling Vision Models Does Not Consistently Improve Localisation-Based Explanation Quality
von: Cedro, Mateusz, et al.
Veröffentlicht: (2026)
von: Cedro, Mateusz, et al.
Veröffentlicht: (2026)
Navigating the Exploration-Exploitation Tradeoff in Inference-Time Scaling of Diffusion Models
von: Su, Xun, et al.
Veröffentlicht: (2025)
von: Su, Xun, et al.
Veröffentlicht: (2025)
Evaluating Large Language Models for Phishing Detection, Self-Consistency, Faithfulness, and Explainability
von: Kuikel, Shova, et al.
Veröffentlicht: (2025)
von: Kuikel, Shova, et al.
Veröffentlicht: (2025)
Towards CausalGPT: A Multi-Agent Approach for Faithful Knowledge Reasoning via Promoting Causal Consistency in LLMs
von: Tang, Ziyi, et al.
Veröffentlicht: (2023)
von: Tang, Ziyi, et al.
Veröffentlicht: (2023)
A Necessary Step toward Faithfulness: Measuring and Improving Consistency in Free-Text Explanations
von: Zhao, Lingjun, et al.
Veröffentlicht: (2025)
von: Zhao, Lingjun, et al.
Veröffentlicht: (2025)
Accelerating Large-Scale Reasoning Model Inference with Sparse Self-Speculative Decoding
von: Zhao, Yilong, et al.
Veröffentlicht: (2025)
von: Zhao, Yilong, et al.
Veröffentlicht: (2025)
Self-Consistency of the Internal Reward Models Improves Self-Rewarding Language Models
von: Zhou, Xin, et al.
Veröffentlicht: (2025)
von: Zhou, Xin, et al.
Veröffentlicht: (2025)
Self-Training Meets Consistency: Improving LLMs' Reasoning with Consistency-Driven Rationale Evaluation
von: Lee, Jaehyeok, et al.
Veröffentlicht: (2024)
von: Lee, Jaehyeok, et al.
Veröffentlicht: (2024)
Reasoning or Overthinking: Evaluating Large Language Models on Financial Sentiment Analysis
von: Vamvourellis, Dimitris, et al.
Veröffentlicht: (2025)
von: Vamvourellis, Dimitris, et al.
Veröffentlicht: (2025)
Measuring the Faithfulness of Thinking Drafts in Large Reasoning Models
von: Xiong, Zidi, et al.
Veröffentlicht: (2025)
von: Xiong, Zidi, et al.
Veröffentlicht: (2025)
How Much Cache Does Reasoning Need? Depth-Cache Tradeoffs in KV-Compressed Transformers
von: Wang, Xiao
Veröffentlicht: (2026)
von: Wang, Xiao
Veröffentlicht: (2026)
Multi-Object Tracking Consistently Improves Wildlife Inference
von: Muthivhi, Mufhumudzi, et al.
Veröffentlicht: (2026)
von: Muthivhi, Mufhumudzi, et al.
Veröffentlicht: (2026)
Improving Multi-turn Dialogue Consistency with Self-Recall Thinking
von: Pang, Renning, et al.
Veröffentlicht: (2026)
von: Pang, Renning, et al.
Veröffentlicht: (2026)
Reasoning on Graphs: Faithful and Interpretable Large Language Model Reasoning
von: Luo, Linhao, et al.
Veröffentlicht: (2023)
von: Luo, Linhao, et al.
Veröffentlicht: (2023)
FaithCoT-Bench: Benchmarking Instance-Level Faithfulness of Chain-of-Thought Reasoning
von: Shen, Xu, et al.
Veröffentlicht: (2025)
von: Shen, Xu, et al.
Veröffentlicht: (2025)
Improving LLM Reasoning through Scaling Inference Computation with Collaborative Verification
von: Liang, Zhenwen, et al.
Veröffentlicht: (2024)
von: Liang, Zhenwen, et al.
Veröffentlicht: (2024)
When Agents Disagree With Themselves: Measuring Behavioral Consistency in LLM-Based Agents
von: Mehta, Aman
Veröffentlicht: (2026)
von: Mehta, Aman
Veröffentlicht: (2026)
Lie to Me: How Faithful Is Chain-of-Thought Reasoning in Reasoning Models?
von: Young, Richard J.
Veröffentlicht: (2026)
von: Young, Richard J.
Veröffentlicht: (2026)
VecCISC: Improving Confidence-Informed Self-Consistency with Reasoning Trace Clustering and Candidate Answer Selection
von: Petullo, James, et al.
Veröffentlicht: (2026)
von: Petullo, James, et al.
Veröffentlicht: (2026)
LIMEtree: Consistent and Faithful Surrogate Explanations of Multiple Classes
von: Sokol, Kacper, et al.
Veröffentlicht: (2020)
von: Sokol, Kacper, et al.
Veröffentlicht: (2020)
Optimal Self-Consistency for Efficient Reasoning with Large Language Models
von: Feng, Austin, et al.
Veröffentlicht: (2025)
von: Feng, Austin, et al.
Veröffentlicht: (2025)
RFEval: Benchmarking Reasoning Faithfulness under Counterfactual Reasoning Intervention in Large Reasoning Models
von: Han, Yunseok, et al.
Veröffentlicht: (2026)
von: Han, Yunseok, et al.
Veröffentlicht: (2026)
Confidence Improves Self-Consistency in LLMs
von: Taubenfeld, Amir, et al.
Veröffentlicht: (2025)
von: Taubenfeld, Amir, et al.
Veröffentlicht: (2025)
Consistency Amplifies: How Behavioral Variance Shapes Agent Accuracy
von: Mehta, Aman
Veröffentlicht: (2026)
von: Mehta, Aman
Veröffentlicht: (2026)
Balancing Faithfulness and Performance in Reasoning via Multi-Listener Soft Execution
von: Sivakumaran, Nithin, et al.
Veröffentlicht: (2026)
von: Sivakumaran, Nithin, et al.
Veröffentlicht: (2026)
Modeling Multi-Objective Tradeoffs with Monotonic Utility Functions
von: Chen, Edward, et al.
Veröffentlicht: (2024)
von: Chen, Edward, et al.
Veröffentlicht: (2024)
MAMM-Refine: A Recipe for Improving Faithfulness in Generation with Multi-Agent Collaboration
von: Wan, David, et al.
Veröffentlicht: (2025)
von: Wan, David, et al.
Veröffentlicht: (2025)
The Refusal--Compliance Tradeoff: A Large-Scale Safety Behavior Audit of Large Language Models
von: Hasan, Alif Al, et al.
Veröffentlicht: (2026)
von: Hasan, Alif Al, et al.
Veröffentlicht: (2026)
Faithful or Just Plausible? Evaluating the Faithfulness of Closed-Source LLMs in Medical Reasoning
von: Afolabi, Halimat, et al.
Veröffentlicht: (2026)
von: Afolabi, Halimat, et al.
Veröffentlicht: (2026)
Dissociation of Faithful and Unfaithful Reasoning in LLMs
von: Yee, Evelyn, et al.
Veröffentlicht: (2024)
von: Yee, Evelyn, et al.
Veröffentlicht: (2024)
Soft Self-Consistency Improves Language Model Agents
von: Wang, Han, et al.
Veröffentlicht: (2024)
von: Wang, Han, et al.
Veröffentlicht: (2024)
Self-Consistency Boosts Calibration for Math Reasoning
von: Wang, Ante, et al.
Veröffentlicht: (2024)
von: Wang, Ante, et al.
Veröffentlicht: (2024)
Cross-Lingual Consistency: A Novel Inference Framework for Advancing Reasoning in Large Language Models
von: Yu, Zhiwei, et al.
Veröffentlicht: (2025)
von: Yu, Zhiwei, et al.
Veröffentlicht: (2025)
Ähnliche Einträge
-
Verbosity Tradeoffs and the Impact of Scale on the Faithfulness of LLM Self-Explanations
von: Siegel, Noah Y., et al.
Veröffentlicht: (2025) -
Can We Trust AI Explanations? Evidence of Systematic Underreporting in Chain-of-Thought Reasoning
von: Mehta, Deep Pankajbhai
Veröffentlicht: (2025) -
When Does Multi-Agent RL Improve LLM Workflows? Workflow, Scale, and Policy-Sharing Tradeoffs
von: Zeng, Yifan, et al.
Veröffentlicht: (2026) -
CanaryBench: Stress Testing Privacy Leakage in Cluster-Level Conversation Summaries
von: Mehta, Deep
Veröffentlicht: (2026) -
Improving Faithfulness of Large Language Models in Summarization via Sliding Generation and Self-Consistency
von: Li, Taiji, et al.
Veröffentlicht: (2024)