Gespeichert in:
| Hauptverfasser: | Zhai, Haotian, Stengel-Eskin, Elias, Patil, Pratik, Leqi, Liu |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2026
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2602.23271 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
The Sum Leaks More Than Its Parts: Compositional Privacy Risks and Mitigations in Multi-Agent Collaboration
von: Patil, Vaidehi, et al.
Veröffentlicht: (2025)
von: Patil, Vaidehi, et al.
Veröffentlicht: (2025)
UPCORE: Utility-Preserving Coreset Selection for Balanced Unlearning
von: Patil, Vaidehi, et al.
Veröffentlicht: (2025)
von: Patil, Vaidehi, et al.
Veröffentlicht: (2025)
Calibrating Verbalized Confidence with Self-Generated Distractors
von: Wang, Victor, et al.
Veröffentlicht: (2025)
von: Wang, Victor, et al.
Veröffentlicht: (2025)
Generalized Correctness Models: Learning Calibrated and Model-Agnostic Correctness Predictors from Historical Patterns
von: Xiao, Hanqi, et al.
Veröffentlicht: (2025)
von: Xiao, Hanqi, et al.
Veröffentlicht: (2025)
Playing Along: Learning a Double-Agent Defender for Belief Steering via Theory of Mind
von: Xiao, Hanqi, et al.
Veröffentlicht: (2026)
von: Xiao, Hanqi, et al.
Veröffentlicht: (2026)
Soft Self-Consistency Improves Language Model Agents
von: Wang, Han, et al.
Veröffentlicht: (2024)
von: Wang, Han, et al.
Veröffentlicht: (2024)
LACIE: Listener-Aware Finetuning for Confidence Calibration in Large Language Models
von: Stengel-Eskin, Elias, et al.
Veröffentlicht: (2024)
von: Stengel-Eskin, Elias, et al.
Veröffentlicht: (2024)
Teaching Models to Balance Resisting and Accepting Persuasion
von: Stengel-Eskin, Elias, et al.
Veröffentlicht: (2024)
von: Stengel-Eskin, Elias, et al.
Veröffentlicht: (2024)
Language Models Identify Ambiguities and Exploit Loopholes
von: Choi, Jio, et al.
Veröffentlicht: (2025)
von: Choi, Jio, et al.
Veröffentlicht: (2025)
DataEnvGym: Data Generation Agents in Teacher Environments with Student Feedback
von: Khan, Zaid, et al.
Veröffentlicht: (2024)
von: Khan, Zaid, et al.
Veröffentlicht: (2024)
One Life to Learn: Inferring Symbolic World Models for Stochastic Environments from Unguided Exploration
von: Khan, Zaid, et al.
Veröffentlicht: (2025)
von: Khan, Zaid, et al.
Veröffentlicht: (2025)
RotBench: Evaluating Multimodal Large Language Models on Identifying Image Rotation
von: Niu, Tianyi, et al.
Veröffentlicht: (2025)
von: Niu, Tianyi, et al.
Veröffentlicht: (2025)
MAMM-Refine: A Recipe for Improving Faithfulness in Generation with Multi-Agent Collaboration
von: Wan, David, et al.
Veröffentlicht: (2025)
von: Wan, David, et al.
Veröffentlicht: (2025)
CAPTURe: Evaluating Spatial Reasoning in Vision Language Models via Occluded Object Counting
von: Pothiraj, Atin, et al.
Veröffentlicht: (2025)
von: Pothiraj, Atin, et al.
Veröffentlicht: (2025)
Rephrase, Augment, Reason: Visual Grounding of Questions for Vision-Language Models
von: Prasad, Archiki, et al.
Veröffentlicht: (2023)
von: Prasad, Archiki, et al.
Veröffentlicht: (2023)
ReGAL: Refactoring Programs to Discover Generalizable Abstractions
von: Stengel-Eskin, Elias, et al.
Veröffentlicht: (2024)
von: Stengel-Eskin, Elias, et al.
Veröffentlicht: (2024)
Are language models rational? The case of coherence norms and belief revision
von: Hofweber, Thomas, et al.
Veröffentlicht: (2024)
von: Hofweber, Thomas, et al.
Veröffentlicht: (2024)
Retrieval-Augmented Generation with Conflicting Evidence
von: Wang, Han, et al.
Veröffentlicht: (2025)
von: Wang, Han, et al.
Veröffentlicht: (2025)
Multi-Attribute Steering of Language Models via Targeted Intervention
von: Nguyen, Duy, et al.
Veröffentlicht: (2025)
von: Nguyen, Duy, et al.
Veröffentlicht: (2025)
GrAInS: Gradient-based Attribution for Inference-Time Steering of LLMs and VLMs
von: Nguyen, Duy, et al.
Veröffentlicht: (2025)
von: Nguyen, Duy, et al.
Veröffentlicht: (2025)
Task-Circuit Quantization: Leveraging Knowledge Localization and Interpretability for Compression
von: Xiao, Hanqi, et al.
Veröffentlicht: (2025)
von: Xiao, Hanqi, et al.
Veröffentlicht: (2025)
EquivaMap: Leveraging LLMs for Automatic Equivalence Checking of Optimization Formulations
von: Zhai, Haotian, et al.
Veröffentlicht: (2025)
von: Zhai, Haotian, et al.
Veröffentlicht: (2025)
GenerationPrograms: Fine-grained Attribution with Executable Programs
von: Wan, David, et al.
Veröffentlicht: (2025)
von: Wan, David, et al.
Veröffentlicht: (2025)
Fundamental Problems With Model Editing: How Should Rational Belief Revision Work in LLMs?
von: Hase, Peter, et al.
Veröffentlicht: (2024)
von: Hase, Peter, et al.
Veröffentlicht: (2024)
Contrastive Region Guidance: Improving Grounding in Vision-Language Models without Training
von: Wan, David, et al.
Veröffentlicht: (2024)
von: Wan, David, et al.
Veröffentlicht: (2024)
See It from My Perspective: How Language Affects Cultural Bias in Image Understanding
von: Ananthram, Amith, et al.
Veröffentlicht: (2024)
von: Ananthram, Amith, et al.
Veröffentlicht: (2024)
Executable Functional Abstractions: Inferring Generative Programs for Advanced Math Problems
von: Khan, Zaid, et al.
Veröffentlicht: (2025)
von: Khan, Zaid, et al.
Veröffentlicht: (2025)
Language-guided Skill Learning with Temporal Variational Inference
von: Fu, Haotian, et al.
Veröffentlicht: (2024)
von: Fu, Haotian, et al.
Veröffentlicht: (2024)
GPU Forecasters: Language Models as Selective Surrogates for Kernel Runtime Optimization
von: Khan, Zaid, et al.
Veröffentlicht: (2026)
von: Khan, Zaid, et al.
Veröffentlicht: (2026)
Skill-Based Mixture-of-Experts: Adaptive Routing for Heterogeneous Reasoning via Inferred Skills
von: Chen, Justin Chih-Yao, et al.
Veröffentlicht: (2025)
von: Chen, Justin Chih-Yao, et al.
Veröffentlicht: (2025)
DART: Leveraging Multi-Agent Disagreement for Tool Recruitment in Multimodal Reasoning
von: Sivakumaran, Nithin, et al.
Veröffentlicht: (2025)
von: Sivakumaran, Nithin, et al.
Veröffentlicht: (2025)
Agent-BRACE: Decoupling Beliefs from Actions in Long-Horizon Tasks via Verbalized State Uncertainty
von: Singh, Joykirat, et al.
Veröffentlicht: (2026)
von: Singh, Joykirat, et al.
Veröffentlicht: (2026)
Balancing Faithfulness and Performance in Reasoning via Multi-Listener Soft Execution
von: Sivakumaran, Nithin, et al.
Veröffentlicht: (2026)
von: Sivakumaran, Nithin, et al.
Veröffentlicht: (2026)
Multimodal Fact-Level Attribution for Verifiable Reasoning
von: Wan, David, et al.
Veröffentlicht: (2026)
von: Wan, David, et al.
Veröffentlicht: (2026)
Learning to Generate Unit Tests for Automated Debugging
von: Prasad, Archiki, et al.
Veröffentlicht: (2025)
von: Prasad, Archiki, et al.
Veröffentlicht: (2025)
GTBench: Uncovering the Strategic Reasoning Limitations of LLMs via Game-Theoretic Evaluations
von: Duan, Jinhao, et al.
Veröffentlicht: (2024)
von: Duan, Jinhao, et al.
Veröffentlicht: (2024)
Think Right: Learning to Mitigate Under-Over Thinking via Adaptive, Attentive Compression
von: Singh, Joykirat, et al.
Veröffentlicht: (2025)
von: Singh, Joykirat, et al.
Veröffentlicht: (2025)
System-1.x: Learning to Balance Fast and Slow Planning with Language Models
von: Saha, Swarnadeep, et al.
Veröffentlicht: (2024)
von: Saha, Swarnadeep, et al.
Veröffentlicht: (2024)
PRInTS: Reward Modeling for Long-Horizon Information Seeking
von: Lee, Jaewoo, et al.
Veröffentlicht: (2025)
von: Lee, Jaewoo, et al.
Veröffentlicht: (2025)
VideoTree: Adaptive Tree-based Video Representation for LLM Reasoning on Long Videos
von: Wang, Ziyang, et al.
Veröffentlicht: (2024)
von: Wang, Ziyang, et al.
Veröffentlicht: (2024)
Ähnliche Einträge
-
The Sum Leaks More Than Its Parts: Compositional Privacy Risks and Mitigations in Multi-Agent Collaboration
von: Patil, Vaidehi, et al.
Veröffentlicht: (2025) -
UPCORE: Utility-Preserving Coreset Selection for Balanced Unlearning
von: Patil, Vaidehi, et al.
Veröffentlicht: (2025) -
Calibrating Verbalized Confidence with Self-Generated Distractors
von: Wang, Victor, et al.
Veröffentlicht: (2025) -
Generalized Correctness Models: Learning Calibrated and Model-Agnostic Correctness Predictors from Historical Patterns
von: Xiao, Hanqi, et al.
Veröffentlicht: (2025) -
Playing Along: Learning a Double-Agent Defender for Belief Steering via Theory of Mind
von: Xiao, Hanqi, et al.
Veröffentlicht: (2026)