:: Library Catalog

Image de couverture de livre

Enregistré dans:

Détails bibliographiques
Auteurs principaux:	Voigt, Henrik, Habeck, Michael, Giesen, Joachim
Format:	Preprint
Publié:	2026
Sujets:	Machine Learning Artificial Intelligence Computation and Language
Accès en ligne:	https://arxiv.org/abs/2604.27551
Tags:	Ajouter un tag Pas de tags, Soyez le premier à ajouter un tag!

Documents similaires

Analyzing Generalization in Pre-Trained Symbolic Regression
par: Voigt, Henrik, et autres
Publié: (2025)

Scaling Up Unbiased Search-based Symbolic Regression
par: Kahlmeyer, Paul, et autres
Publié: (2025)

Neural Task Synthesis for Visual Programming
par: Pădurean, Victor-Alexandru, et autres
Publié: (2023)

In-context Pretraining: Language Modeling Beyond Document Boundaries
par: Shi, Weijia, et autres
Publié: (2023)

Generating Pragmatic Examples to Train Neural Program Synthesizers
par: Vaduguru, Saujas, et autres
Publié: (2023)

Emergent Representations of Program Semantics in Language Models Trained on Programs
par: Jin, Charles, et autres
Publié: (2023)

Adaptive-Boundary-Clipping GRPO: Ensuring Bounded Ratios for Stable and Generalizable Training
par: Liu, Chi, et autres
Publié: (2026)

Mapping Post-Training Forgetting in Language Models at Scale
par: Harmon, Jackson, et autres
Publié: (2025)

Beyond Binary Rewards: Training LMs to Reason About Their Uncertainty
par: Damani, Mehul, et autres
Publié: (2025)

Reaching Beyond the Mode: RL for Distributional Reasoning in Language Models
par: Puri, Isha, et autres
Publié: (2026)

Quokka: Accelerating Program Verification with LLMs via Invariant Synthesis
par: Wei, Anjiang, et autres
Publié: (2025)

Beyond Perplexity: A Geometric and Spectral Study of Low-Rank Pre-Training
par: Shivagunde, Namrata, et autres
Publié: (2026)

Beyond Next Token Prediction: Patch-Level Training for Large Language Models
par: Shao, Chenze, et autres
Publié: (2024)

Training Language Models via Neural Cellular Automata
par: Lee, Dan, et autres
Publié: (2026)

Interactive Training: Feedback-Driven Neural Network Optimization
par: Zhang, Wentao, et autres
Publié: (2025)

Once Upon an Input: Reasoning via Per-Instance Program Synthesis
par: Stein, Adam, et autres
Publié: (2025)

Towards Efficient Neurally-Guided Program Induction for ARC-AGI
par: Ouellette, Simon
Publié: (2024)

Exploring RL-based LLM Training for Formal Language Tasks with Programmed Rewards
par: Padula, Alexander G., et autres
Publié: (2024)

Beyond Single Concept Vector: Modeling Concept Subspace in LLMs with Gaussian Distribution
par: Zhao, Haiyan, et autres
Publié: (2024)

AWARE, Beyond Sentence Boundaries: A Contextual Transformer Framework for Identifying Cultural Capital in STEM Narratives
par: Khan, Khalid Mehtab, et autres
Publié: (2025)

Mitigating Distribution Sharpening in Math RLVR via Distribution-Aligned Hint Synthesis and Backward Hint Annealing
par: Xie, Pei-Xi, et autres
Publié: (2026)

CodeARC: Benchmarking Reasoning Capabilities of LLM Agents for Inductive Program Synthesis
par: Wei, Anjiang, et autres
Publié: (2025)

$Q\sharp$: Provably Optimal Distributional RL for LLM Post-Training
par: Zhou, Jin Peng, et autres
Publié: (2025)

LLMs Don't Know Their Own Decision Boundaries: The Unreliability of Self-Generated Counterfactual Explanations
par: Mayne, Harry, et autres
Publié: (2025)

Training a Generally Curious Agent
par: Tajwar, Fahim, et autres
Publié: (2025)

A Real-World WebAgent with Planning, Long Context Understanding, and Program Synthesis
par: Gur, Izzeddin, et autres
Publié: (2023)

InversionView: A General-Purpose Method for Reading Information from Neural Activations
par: Huang, Xinting, et autres
Publié: (2024)

Beyond the Singular: Revealing the Value of Multiple Generations in Benchmark Evaluation
par: Zhang, Wenbo, et autres
Publié: (2025)

Easy-to-Hard Generalization: Scalable Alignment Beyond Human Supervision
par: Sun, Zhiqing, et autres
Publié: (2024)

Symmetry-Constrained Language-Guided Program Synthesis for Discovering Governing Equations from Noisy and Partial Observations
par: Baig, Mirza Samad Ahmed, et autres
Publié: (2026)

Does Refusal Training in LLMs Generalize to the Past Tense?
par: Andriushchenko, Maksym, et autres
Publié: (2024)

Forking Paths in Neural Text Generation
par: Bigelow, Eric, et autres
Publié: (2024)

Policy-Gradient Training of Language Models for Ranking
par: Gao, Ge, et autres
Publié: (2023)

Beyond LLM-as-a-Judge: Deterministic Metrics for Multilingual Generative Text Evaluation
par: Alam, Firoj, et autres
Publié: (2026)

Beyond Scalar Reward Model: Learning Generative Judge from Preference Data
par: Ye, Ziyi, et autres
Publié: (2024)

Training and Evaluating Language Models with Template-based Data Generation
par: Zhang, Yifan
Publié: (2024)

Post-training an LLM for RAG? Train on Self-Generated Demonstrations
par: Finlayson, Matthew, et autres
Publié: (2025)

Knowledge Boundary Discovery for Large Language Models
par: Wang, Ziquan, et autres
Publié: (2026)

Executable Functional Abstractions: Inferring Generative Programs for Advanced Math Problems
par: Khan, Zaid, et autres
Publié: (2025)

Phrase-Level Adversarial Training for Mitigating Bias in Neural Network-based Automatic Essay Scoring
par: Philip, Haddad, et autres
Publié: (2024)