Salvato in:
| Autore principale: | Chandrasekaran, Sankaranarayanan Palamadai |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2026
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2605.27768 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
To Steer or Not to Steer? Mechanistic Error Reduction with Abstention for Language Models
di: Hedström, Anna, et al.
Pubblicazione: (2025)
di: Hedström, Anna, et al.
Pubblicazione: (2025)
From Attribution to Abstention: Training-Free Attention-Based Auditing for Clinical Summarization
di: Yan, Qianqi, et al.
Pubblicazione: (2026)
di: Yan, Qianqi, et al.
Pubblicazione: (2026)
Interpretable Steering of Large Language Models with Feature Guided Activation Additions
di: Soo, Samuel, et al.
Pubblicazione: (2025)
di: Soo, Samuel, et al.
Pubblicazione: (2025)
Bounded-Abstention Pairwise Learning to Rank
di: Ferrara, Antonio, et al.
Pubblicazione: (2025)
di: Ferrara, Antonio, et al.
Pubblicazione: (2025)
ClinDet-Bench: Beyond Abstention, Evaluating Judgment Determinability of LLMs in Clinical Decision-Making
di: Watanabe, Yusuke, et al.
Pubblicazione: (2026)
di: Watanabe, Yusuke, et al.
Pubblicazione: (2026)
Concept-Level Explainability for Auditing & Steering LLM Responses
di: Amara, Kenza, et al.
Pubblicazione: (2025)
di: Amara, Kenza, et al.
Pubblicazione: (2025)
Task Abstention for Large Language Models in Code Generation
di: Zhou, Yanke, et al.
Pubblicazione: (2026)
di: Zhou, Yanke, et al.
Pubblicazione: (2026)
Reliable Text-to-SQL with Adaptive Abstention
di: Chen, Kaiwen, et al.
Pubblicazione: (2025)
di: Chen, Kaiwen, et al.
Pubblicazione: (2025)
Cost-Saving LLM Cascades with Early Abstention
di: Zellinger, Michael J., et al.
Pubblicazione: (2025)
di: Zellinger, Michael J., et al.
Pubblicazione: (2025)
Learning When Not to Learn: Risk-Sensitive Abstention in Bandits with Unbounded Rewards
di: Liaw, Sarah, et al.
Pubblicazione: (2025)
di: Liaw, Sarah, et al.
Pubblicazione: (2025)
AbstentionBench: Reasoning LLMs Fail on Unanswerable Questions
di: Kirichenko, Polina, et al.
Pubblicazione: (2025)
di: Kirichenko, Polina, et al.
Pubblicazione: (2025)
Learning Conformal Abstention Policies for Adaptive Risk Management in Large Language and Vision-Language Models
di: Tayebati, Sina, et al.
Pubblicazione: (2025)
di: Tayebati, Sina, et al.
Pubblicazione: (2025)
Knowledge Graph Guided Evaluation of Abstention Techniques
di: Vasisht, Kinshuk, et al.
Pubblicazione: (2024)
di: Vasisht, Kinshuk, et al.
Pubblicazione: (2024)
Generalizing Abstention for Noise-Robust Learning in Medical Image Segmentation
di: Moustafa, Wesam, et al.
Pubblicazione: (2026)
di: Moustafa, Wesam, et al.
Pubblicazione: (2026)
Answering the Wrong Question: Reasoning Trace Inversion for Abstention in LLMs
di: Gourabathina, Abinitha, et al.
Pubblicazione: (2026)
di: Gourabathina, Abinitha, et al.
Pubblicazione: (2026)
Improving LLM Reliability through Hybrid Abstention and Adaptive Detection
di: Sharma, Ankit, et al.
Pubblicazione: (2026)
di: Sharma, Ankit, et al.
Pubblicazione: (2026)
Worst-Case Convergence Time of ML Algorithms via Extreme Value Theory
di: Tizpaz-Niari, Saeid, et al.
Pubblicazione: (2024)
di: Tizpaz-Niari, Saeid, et al.
Pubblicazione: (2024)
Confidential Guardian: Cryptographically Prohibiting the Abuse of Model Abstention
di: Rabanser, Stephan, et al.
Pubblicazione: (2025)
di: Rabanser, Stephan, et al.
Pubblicazione: (2025)
Knowing When Not to Answer: Abstention-Aware Scientific Reasoning
di: Abdaljalil, Samir, et al.
Pubblicazione: (2026)
di: Abdaljalil, Samir, et al.
Pubblicazione: (2026)
Real-Time Integrated Dispatching and Idle Fleet Steering with Deep Reinforcement Learning for A Meal Delivery Platform
di: Cheng, Jingyi, et al.
Pubblicazione: (2025)
di: Cheng, Jingyi, et al.
Pubblicazione: (2025)
Mitigating LLM Hallucinations via Conformal Abstention
di: Yadkori, Yasin Abbasi, et al.
Pubblicazione: (2024)
di: Yadkori, Yasin Abbasi, et al.
Pubblicazione: (2024)
Mitigating "Epistemic Debt" in Generative AI-Scaffolded Novice Programming using Metacognitive Scripts
di: Sankaranarayanan, Sreecharan
Pubblicazione: (2026)
di: Sankaranarayanan, Sreecharan
Pubblicazione: (2026)
Disjoint Processing Mechanisms of Hierarchical and Linear Grammars in Large Language Models
di: Sankaranarayanan, Aruna, et al.
Pubblicazione: (2025)
di: Sankaranarayanan, Aruna, et al.
Pubblicazione: (2025)
Second Guess: Detecting Uncertainty Through Abstention and Answer Stability in Small Language Models
di: Aravindan, Ashwath Vaithinathan, et al.
Pubblicazione: (2026)
di: Aravindan, Ashwath Vaithinathan, et al.
Pubblicazione: (2026)
Energy Landscapes Enable Reliable Abstention in Retrieval-Augmented Large Language Models for Healthcare
di: Shankar, Ravi, et al.
Pubblicazione: (2025)
di: Shankar, Ravi, et al.
Pubblicazione: (2025)
Answering the Unanswerable Is to Err Knowingly: Analyzing and Mitigating Abstention Failures in Large Reasoning Models
di: Liu, Yi, et al.
Pubblicazione: (2025)
di: Liu, Yi, et al.
Pubblicazione: (2025)
Hallucinate Less by Thinking More: Aspect-Based Causal Abstention for Large Language Models
di: Nguyen, Vy, et al.
Pubblicazione: (2025)
di: Nguyen, Vy, et al.
Pubblicazione: (2025)
Knowing When Not to Predict: Self Supervised Learning and Abstention for Safer DR Screening
di: Chopra, Muskaan, et al.
Pubblicazione: (2026)
di: Chopra, Muskaan, et al.
Pubblicazione: (2026)
An Explainable Agentic AI Framework for Uncertainty-Aware and Abstention-Enabled Acute Ischemic Stroke Imaging Decisions
di: Islam, Md Rashadul
Pubblicazione: (2026)
di: Islam, Md Rashadul
Pubblicazione: (2026)
Uncertainty-Based Abstention in LLMs Improves Safety and Reduces Hallucinations
di: Tomani, Christian, et al.
Pubblicazione: (2024)
di: Tomani, Christian, et al.
Pubblicazione: (2024)
Generative Monoculture in Large Language Models
di: Wu, Fan, et al.
Pubblicazione: (2024)
di: Wu, Fan, et al.
Pubblicazione: (2024)
FaithSteer-BENCH: A Deployment-Aligned Stress-Testing Benchmark for Inference-Time Steering
di: Ding, Zikang, et al.
Pubblicazione: (2026)
di: Ding, Zikang, et al.
Pubblicazione: (2026)
SEAT: Sparse Entity-Aware Tuning for Knowledge Adaptation while Preserving Epistemic Abstention
di: Shen, William F., et al.
Pubblicazione: (2025)
di: Shen, William F., et al.
Pubblicazione: (2025)
I-CALM: Incentivizing Confidence-Aware Abstention for LLM Hallucination Mitigation
di: Zong, Haotian, et al.
Pubblicazione: (2026)
di: Zong, Haotian, et al.
Pubblicazione: (2026)
CausalAbstain: Enhancing Multilingual LLMs with Causal Reasoning for Trustworthy Abstention
di: Sun, Yuxi, et al.
Pubblicazione: (2025)
di: Sun, Yuxi, et al.
Pubblicazione: (2025)
ACAR: Adaptive Complexity Routing for Multi-Model Ensembles with Auditable Decision Traces
di: Kumaresan, Ramchand
Pubblicazione: (2026)
di: Kumaresan, Ramchand
Pubblicazione: (2026)
CoSteer: Collaborative Decoding-Time Personalization via Local Delta Steering
di: Lv, Hang, et al.
Pubblicazione: (2025)
di: Lv, Hang, et al.
Pubblicazione: (2025)
Agentic AI for Autonomous, Explainable, and Real-Time Credit Risk Decision-Making
di: Kubam, Chandra Sekhar
Pubblicazione: (2025)
di: Kubam, Chandra Sekhar
Pubblicazione: (2025)
LatentAudit: Real-Time White-Box Faithfulness Monitoring for Retrieval-Augmented Generation with Verifiable Deployment
di: Yu, Zhe, et al.
Pubblicazione: (2026)
di: Yu, Zhe, et al.
Pubblicazione: (2026)
Explicit Abstention Knobs for Predictable Reliability in Video Question Answering
di: Ortiz, Jorge
Pubblicazione: (2025)
di: Ortiz, Jorge
Pubblicazione: (2025)
Documenti analoghi
-
To Steer or Not to Steer? Mechanistic Error Reduction with Abstention for Language Models
di: Hedström, Anna, et al.
Pubblicazione: (2025) -
From Attribution to Abstention: Training-Free Attention-Based Auditing for Clinical Summarization
di: Yan, Qianqi, et al.
Pubblicazione: (2026) -
Interpretable Steering of Large Language Models with Feature Guided Activation Additions
di: Soo, Samuel, et al.
Pubblicazione: (2025) -
Bounded-Abstention Pairwise Learning to Rank
di: Ferrara, Antonio, et al.
Pubblicazione: (2025) -
ClinDet-Bench: Beyond Abstention, Evaluating Judgment Determinability of LLMs in Clinical Decision-Making
di: Watanabe, Yusuke, et al.
Pubblicazione: (2026)