Enregistré dans:
| Auteurs principaux: | Liu, Rongxing, Shridhar, Kumar, Prajapat, Manish, Xia, Patrick, Sachan, Mrinmaya |
|---|---|
| Format: | Preprint |
| Publié: |
2024
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2410.16128 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
SIKeD: Self-guided Iterative Knowledge Distillation for mathematical reasoning
par: Adarsh, Shivam, et autres
Publié: (2024)
par: Adarsh, Shivam, et autres
Publié: (2024)
Stepwise Verification and Remediation of Student Reasoning Errors with Large Language Model Tutors
par: Daheim, Nico, et autres
Publié: (2024)
par: Daheim, Nico, et autres
Publié: (2024)
Simulating Students or Sycophantic Problem Solving? On Misconception Faithfulness of LLM Simulators
par: Do, Heejin, et autres
Publié: (2026)
par: Do, Heejin, et autres
Publié: (2026)
Variational Classification
par: Dhuliawala, Shehzaad, et autres
Publié: (2023)
par: Dhuliawala, Shehzaad, et autres
Publié: (2023)
Improving Large Language Model Safety with Contrastive Representation Learning
par: Simko, Samuel, et autres
Publié: (2025)
par: Simko, Samuel, et autres
Publié: (2025)
Learning to Reason Efficiently with A* Post-Training
par: Opedal, Andreas, et autres
Publié: (2026)
par: Opedal, Andreas, et autres
Publié: (2026)
Towards Aligning Language Models with Textual Feedback
par: Lloret, Saüc Abadal, et autres
Publié: (2024)
par: Lloret, Saüc Abadal, et autres
Publié: (2024)
Tackling the Root of Misinformation by Teaching Laypeople about Logical Fallacies via Socratic Questioning and Critical Argumentation
par: Shi, Minjing, et autres
Publié: (2026)
par: Shi, Minjing, et autres
Publié: (2026)
MathGAP: Out-of-Distribution Evaluation on Problems with Arbitrarily Complex Proofs
par: Opedal, Andreas, et autres
Publié: (2024)
par: Opedal, Andreas, et autres
Publié: (2024)
Pointwise Mutual Information as a Performance Gauge for Retrieval-Augmented Generation
par: Liu, Tianyu, et autres
Publié: (2024)
par: Liu, Tianyu, et autres
Publié: (2024)
Distilling LLMs' Decomposition Abilities into Compact Language Models
par: Tarasov, Denis, et autres
Publié: (2024)
par: Tarasov, Denis, et autres
Publié: (2024)
SMART: Self-Aware Agent for Tool Overuse Mitigation
par: Qian, Cheng, et autres
Publié: (2025)
par: Qian, Cheng, et autres
Publié: (2025)
MathTutorBench: A Benchmark for Measuring Open-ended Pedagogical Capabilities of LLM Tutors
par: Macina, Jakub, et autres
Publié: (2025)
par: Macina, Jakub, et autres
Publié: (2025)
Safe Exploration via Policy Priors
par: Wendl, Manuel, et autres
Publié: (2026)
par: Wendl, Manuel, et autres
Publié: (2026)
Are Language Models Efficient Reasoners? A Perspective from Logic Programming
par: Opedal, Andreas, et autres
Publié: (2025)
par: Opedal, Andreas, et autres
Publié: (2025)
Confidence Regulation Neurons in Language Models
par: Stolfo, Alessandro, et autres
Publié: (2024)
par: Stolfo, Alessandro, et autres
Publié: (2024)
Dense SAE Latents Are Features, Not Bugs
par: Sun, Xiaoqing, et autres
Publié: (2025)
par: Sun, Xiaoqing, et autres
Publié: (2025)
Can Large Language Models Infer Causation from Correlation?
par: Jin, Zhijing, et autres
Publié: (2023)
par: Jin, Zhijing, et autres
Publié: (2023)
CLadder: Assessing Causal Reasoning in Language Models
par: Jin, Zhijing, et autres
Publié: (2023)
par: Jin, Zhijing, et autres
Publié: (2023)
CausalCite: A Causal Formulation of Paper Citations
par: Kumar, Ishan, et autres
Publié: (2023)
par: Kumar, Ishan, et autres
Publié: (2023)
Sampling-Based Safe Reinforcement Learning
par: Vignola, Luca, et autres
Publié: (2026)
par: Vignola, Luca, et autres
Publié: (2026)
Autoformalizing Natural Language to First-Order Logic: A Case Study in Logical Fallacy Detection
par: Lalwani, Abhinav, et autres
Publié: (2024)
par: Lalwani, Abhinav, et autres
Publié: (2024)
Do Language Models Exhibit the Same Cognitive Biases in Problem Solving as Human Learners?
par: Opedal, Andreas, et autres
Publié: (2024)
par: Opedal, Andreas, et autres
Publié: (2024)
PerAct2: Benchmarking and Learning for Robotic Bimanual Manipulation Tasks
par: Grotz, Markus, et autres
Publié: (2024)
par: Grotz, Markus, et autres
Publié: (2024)
Quriosity: Analyzing Human Questioning Behavior and Causal Inquiry through Curiosity-Driven Queries
par: Ceraolo, Roberto, et autres
Publié: (2024)
par: Ceraolo, Roberto, et autres
Publié: (2024)
Uncovering Hidden Correctness in LLM Causal Reasoning via Symbolic Verification
par: He, Paul, et autres
Publié: (2026)
par: He, Paul, et autres
Publié: (2026)
The Geometry of Self-Verification in a Task-Specific Reasoning Model
par: Lee, Andrew, et autres
Publié: (2025)
par: Lee, Andrew, et autres
Publié: (2025)
GSO: Challenging Software Optimization Tasks for Evaluating SWE-Agents
par: Shetty, Manish, et autres
Publié: (2025)
par: Shetty, Manish, et autres
Publié: (2025)
Zero-shot Meta-learning for Tabular Prediction Tasks with Adversarially Pre-trained Transformer
par: Wu, Yulun, et autres
Publié: (2025)
par: Wu, Yulun, et autres
Publié: (2025)
Implicit Personalization in Language Models: A Systematic Study
par: Jin, Zhijing, et autres
Publié: (2024)
par: Jin, Zhijing, et autres
Publié: (2024)
Lean Meets Theoretical Computer Science: Scalable Synthesis of Theorem Proving Challenges in Formal-Informal Pairs
par: Zhang, Terry Jingchen, et autres
Publié: (2025)
par: Zhang, Terry Jingchen, et autres
Publié: (2025)
Fluid Representations in Reasoning Models
par: Kharlapenko, Dmitrii, et autres
Publié: (2026)
par: Kharlapenko, Dmitrii, et autres
Publié: (2026)
RLVMR: Reinforcement Learning with Verifiable Meta-Reasoning Rewards for Robust Long-Horizon Agents
par: Zhang, Zijing, et autres
Publié: (2025)
par: Zhang, Zijing, et autres
Publié: (2025)
SMART: Relation-Aware Learning of Geometric Representations for Knowledge Graphs
par: Amouzouvi, Kossi, et autres
Publié: (2025)
par: Amouzouvi, Kossi, et autres
Publié: (2025)
Set-based Meta-Interpolation for Few-Task Meta-Learning
par: Lee, Seanie, et autres
Publié: (2022)
par: Lee, Seanie, et autres
Publié: (2022)
Inefficiencies of Meta Agents for Agent Design
par: El, Batu, et autres
Publié: (2025)
par: El, Batu, et autres
Publié: (2025)
Beyond Training: Enabling Self-Evolution of Agents with MOBIMEM
par: Liu, Zibin, et autres
Publié: (2025)
par: Liu, Zibin, et autres
Publié: (2025)
What Do Language Models Learn in Context? The Structured Task Hypothesis
par: Li, Jiaoda, et autres
Publié: (2024)
par: Li, Jiaoda, et autres
Publié: (2024)
Directed-MAML: Meta Reinforcement Learning Algorithm with Task-directed Approximation
par: Zhang, Yang, et autres
Publié: (2025)
par: Zhang, Yang, et autres
Publié: (2025)
EvolveMem:Self-Evolving Memory Architecture via AutoResearch for LLM Agents
par: Liu, Jiaqi, et autres
Publié: (2026)
par: Liu, Jiaqi, et autres
Publié: (2026)
Documents similaires
-
SIKeD: Self-guided Iterative Knowledge Distillation for mathematical reasoning
par: Adarsh, Shivam, et autres
Publié: (2024) -
Stepwise Verification and Remediation of Student Reasoning Errors with Large Language Model Tutors
par: Daheim, Nico, et autres
Publié: (2024) -
Simulating Students or Sycophantic Problem Solving? On Misconception Faithfulness of LLM Simulators
par: Do, Heejin, et autres
Publié: (2026) -
Variational Classification
par: Dhuliawala, Shehzaad, et autres
Publié: (2023) -
Improving Large Language Model Safety with Contrastive Representation Learning
par: Simko, Samuel, et autres
Publié: (2025)