:: Library Catalog

Image de couverture de livre

Enregistré dans:

Détails bibliographiques
Auteurs principaux:	Liu, Rongxing, Shridhar, Kumar, Prajapat, Manish, Xia, Patrick, Sachan, Mrinmaya
Format:	Preprint
Publié:	2024
Sujets:	Artificial Intelligence Machine Learning
Accès en ligne:	https://arxiv.org/abs/2410.16128
Tags:	Ajouter un tag Pas de tags, Soyez le premier à ajouter un tag!

Documents similaires

SIKeD: Self-guided Iterative Knowledge Distillation for mathematical reasoning
par: Adarsh, Shivam, et autres
Publié: (2024)

Stepwise Verification and Remediation of Student Reasoning Errors with Large Language Model Tutors
par: Daheim, Nico, et autres
Publié: (2024)

Simulating Students or Sycophantic Problem Solving? On Misconception Faithfulness of LLM Simulators
par: Do, Heejin, et autres
Publié: (2026)

Variational Classification
par: Dhuliawala, Shehzaad, et autres
Publié: (2023)

Improving Large Language Model Safety with Contrastive Representation Learning
par: Simko, Samuel, et autres
Publié: (2025)

Learning to Reason Efficiently with A* Post-Training
par: Opedal, Andreas, et autres
Publié: (2026)

Towards Aligning Language Models with Textual Feedback
par: Lloret, Saüc Abadal, et autres
Publié: (2024)

Tackling the Root of Misinformation by Teaching Laypeople about Logical Fallacies via Socratic Questioning and Critical Argumentation
par: Shi, Minjing, et autres
Publié: (2026)

MathGAP: Out-of-Distribution Evaluation on Problems with Arbitrarily Complex Proofs
par: Opedal, Andreas, et autres
Publié: (2024)

Pointwise Mutual Information as a Performance Gauge for Retrieval-Augmented Generation
par: Liu, Tianyu, et autres
Publié: (2024)

Distilling LLMs' Decomposition Abilities into Compact Language Models
par: Tarasov, Denis, et autres
Publié: (2024)

SMART: Self-Aware Agent for Tool Overuse Mitigation
par: Qian, Cheng, et autres
Publié: (2025)

MathTutorBench: A Benchmark for Measuring Open-ended Pedagogical Capabilities of LLM Tutors
par: Macina, Jakub, et autres
Publié: (2025)

Safe Exploration via Policy Priors
par: Wendl, Manuel, et autres
Publié: (2026)

Are Language Models Efficient Reasoners? A Perspective from Logic Programming
par: Opedal, Andreas, et autres
Publié: (2025)

Confidence Regulation Neurons in Language Models
par: Stolfo, Alessandro, et autres
Publié: (2024)

Dense SAE Latents Are Features, Not Bugs
par: Sun, Xiaoqing, et autres
Publié: (2025)

Can Large Language Models Infer Causation from Correlation?
par: Jin, Zhijing, et autres
Publié: (2023)

CLadder: Assessing Causal Reasoning in Language Models
par: Jin, Zhijing, et autres
Publié: (2023)

CausalCite: A Causal Formulation of Paper Citations
par: Kumar, Ishan, et autres
Publié: (2023)

Sampling-Based Safe Reinforcement Learning
par: Vignola, Luca, et autres
Publié: (2026)

Autoformalizing Natural Language to First-Order Logic: A Case Study in Logical Fallacy Detection
par: Lalwani, Abhinav, et autres
Publié: (2024)

Do Language Models Exhibit the Same Cognitive Biases in Problem Solving as Human Learners?
par: Opedal, Andreas, et autres
Publié: (2024)

PerAct2: Benchmarking and Learning for Robotic Bimanual Manipulation Tasks
par: Grotz, Markus, et autres
Publié: (2024)

Quriosity: Analyzing Human Questioning Behavior and Causal Inquiry through Curiosity-Driven Queries
par: Ceraolo, Roberto, et autres
Publié: (2024)

Uncovering Hidden Correctness in LLM Causal Reasoning via Symbolic Verification
par: He, Paul, et autres
Publié: (2026)

The Geometry of Self-Verification in a Task-Specific Reasoning Model
par: Lee, Andrew, et autres
Publié: (2025)

GSO: Challenging Software Optimization Tasks for Evaluating SWE-Agents
par: Shetty, Manish, et autres
Publié: (2025)

Zero-shot Meta-learning for Tabular Prediction Tasks with Adversarially Pre-trained Transformer
par: Wu, Yulun, et autres
Publié: (2025)

Implicit Personalization in Language Models: A Systematic Study
par: Jin, Zhijing, et autres
Publié: (2024)

Lean Meets Theoretical Computer Science: Scalable Synthesis of Theorem Proving Challenges in Formal-Informal Pairs
par: Zhang, Terry Jingchen, et autres
Publié: (2025)

Fluid Representations in Reasoning Models
par: Kharlapenko, Dmitrii, et autres
Publié: (2026)

RLVMR: Reinforcement Learning with Verifiable Meta-Reasoning Rewards for Robust Long-Horizon Agents
par: Zhang, Zijing, et autres
Publié: (2025)

SMART: Relation-Aware Learning of Geometric Representations for Knowledge Graphs
par: Amouzouvi, Kossi, et autres
Publié: (2025)

Set-based Meta-Interpolation for Few-Task Meta-Learning
par: Lee, Seanie, et autres
Publié: (2022)

Inefficiencies of Meta Agents for Agent Design
par: El, Batu, et autres
Publié: (2025)

Beyond Training: Enabling Self-Evolution of Agents with MOBIMEM
par: Liu, Zibin, et autres
Publié: (2025)

What Do Language Models Learn in Context? The Structured Task Hypothesis
par: Li, Jiaoda, et autres
Publié: (2024)

Directed-MAML: Meta Reinforcement Learning Algorithm with Task-directed Approximation
par: Zhang, Yang, et autres
Publié: (2025)

EvolveMem:Self-Evolving Memory Architecture via AutoResearch for LLM Agents
par: Liu, Jiaqi, et autres
Publié: (2026)