Enregistré dans:
| Auteurs principaux: | Voigt, Henrik, Habeck, Michael, Giesen, Joachim |
|---|---|
| Format: | Preprint |
| Publié: |
2026
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2604.27551 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
Analyzing Generalization in Pre-Trained Symbolic Regression
par: Voigt, Henrik, et autres
Publié: (2025)
par: Voigt, Henrik, et autres
Publié: (2025)
Scaling Up Unbiased Search-based Symbolic Regression
par: Kahlmeyer, Paul, et autres
Publié: (2025)
par: Kahlmeyer, Paul, et autres
Publié: (2025)
Neural Task Synthesis for Visual Programming
par: Pădurean, Victor-Alexandru, et autres
Publié: (2023)
par: Pădurean, Victor-Alexandru, et autres
Publié: (2023)
In-context Pretraining: Language Modeling Beyond Document Boundaries
par: Shi, Weijia, et autres
Publié: (2023)
par: Shi, Weijia, et autres
Publié: (2023)
Generating Pragmatic Examples to Train Neural Program Synthesizers
par: Vaduguru, Saujas, et autres
Publié: (2023)
par: Vaduguru, Saujas, et autres
Publié: (2023)
Emergent Representations of Program Semantics in Language Models Trained on Programs
par: Jin, Charles, et autres
Publié: (2023)
par: Jin, Charles, et autres
Publié: (2023)
Adaptive-Boundary-Clipping GRPO: Ensuring Bounded Ratios for Stable and Generalizable Training
par: Liu, Chi, et autres
Publié: (2026)
par: Liu, Chi, et autres
Publié: (2026)
Mapping Post-Training Forgetting in Language Models at Scale
par: Harmon, Jackson, et autres
Publié: (2025)
par: Harmon, Jackson, et autres
Publié: (2025)
Beyond Binary Rewards: Training LMs to Reason About Their Uncertainty
par: Damani, Mehul, et autres
Publié: (2025)
par: Damani, Mehul, et autres
Publié: (2025)
Reaching Beyond the Mode: RL for Distributional Reasoning in Language Models
par: Puri, Isha, et autres
Publié: (2026)
par: Puri, Isha, et autres
Publié: (2026)
Quokka: Accelerating Program Verification with LLMs via Invariant Synthesis
par: Wei, Anjiang, et autres
Publié: (2025)
par: Wei, Anjiang, et autres
Publié: (2025)
Beyond Perplexity: A Geometric and Spectral Study of Low-Rank Pre-Training
par: Shivagunde, Namrata, et autres
Publié: (2026)
par: Shivagunde, Namrata, et autres
Publié: (2026)
Beyond Next Token Prediction: Patch-Level Training for Large Language Models
par: Shao, Chenze, et autres
Publié: (2024)
par: Shao, Chenze, et autres
Publié: (2024)
Training Language Models via Neural Cellular Automata
par: Lee, Dan, et autres
Publié: (2026)
par: Lee, Dan, et autres
Publié: (2026)
Interactive Training: Feedback-Driven Neural Network Optimization
par: Zhang, Wentao, et autres
Publié: (2025)
par: Zhang, Wentao, et autres
Publié: (2025)
Once Upon an Input: Reasoning via Per-Instance Program Synthesis
par: Stein, Adam, et autres
Publié: (2025)
par: Stein, Adam, et autres
Publié: (2025)
Towards Efficient Neurally-Guided Program Induction for ARC-AGI
par: Ouellette, Simon
Publié: (2024)
par: Ouellette, Simon
Publié: (2024)
Exploring RL-based LLM Training for Formal Language Tasks with Programmed Rewards
par: Padula, Alexander G., et autres
Publié: (2024)
par: Padula, Alexander G., et autres
Publié: (2024)
Beyond Single Concept Vector: Modeling Concept Subspace in LLMs with Gaussian Distribution
par: Zhao, Haiyan, et autres
Publié: (2024)
par: Zhao, Haiyan, et autres
Publié: (2024)
AWARE, Beyond Sentence Boundaries: A Contextual Transformer Framework for Identifying Cultural Capital in STEM Narratives
par: Khan, Khalid Mehtab, et autres
Publié: (2025)
par: Khan, Khalid Mehtab, et autres
Publié: (2025)
Mitigating Distribution Sharpening in Math RLVR via Distribution-Aligned Hint Synthesis and Backward Hint Annealing
par: Xie, Pei-Xi, et autres
Publié: (2026)
par: Xie, Pei-Xi, et autres
Publié: (2026)
CodeARC: Benchmarking Reasoning Capabilities of LLM Agents for Inductive Program Synthesis
par: Wei, Anjiang, et autres
Publié: (2025)
par: Wei, Anjiang, et autres
Publié: (2025)
$Q\sharp$: Provably Optimal Distributional RL for LLM Post-Training
par: Zhou, Jin Peng, et autres
Publié: (2025)
par: Zhou, Jin Peng, et autres
Publié: (2025)
LLMs Don't Know Their Own Decision Boundaries: The Unreliability of Self-Generated Counterfactual Explanations
par: Mayne, Harry, et autres
Publié: (2025)
par: Mayne, Harry, et autres
Publié: (2025)
Training a Generally Curious Agent
par: Tajwar, Fahim, et autres
Publié: (2025)
par: Tajwar, Fahim, et autres
Publié: (2025)
A Real-World WebAgent with Planning, Long Context Understanding, and Program Synthesis
par: Gur, Izzeddin, et autres
Publié: (2023)
par: Gur, Izzeddin, et autres
Publié: (2023)
InversionView: A General-Purpose Method for Reading Information from Neural Activations
par: Huang, Xinting, et autres
Publié: (2024)
par: Huang, Xinting, et autres
Publié: (2024)
Beyond the Singular: Revealing the Value of Multiple Generations in Benchmark Evaluation
par: Zhang, Wenbo, et autres
Publié: (2025)
par: Zhang, Wenbo, et autres
Publié: (2025)
Easy-to-Hard Generalization: Scalable Alignment Beyond Human Supervision
par: Sun, Zhiqing, et autres
Publié: (2024)
par: Sun, Zhiqing, et autres
Publié: (2024)
Symmetry-Constrained Language-Guided Program Synthesis for Discovering Governing Equations from Noisy and Partial Observations
par: Baig, Mirza Samad Ahmed, et autres
Publié: (2026)
par: Baig, Mirza Samad Ahmed, et autres
Publié: (2026)
Does Refusal Training in LLMs Generalize to the Past Tense?
par: Andriushchenko, Maksym, et autres
Publié: (2024)
par: Andriushchenko, Maksym, et autres
Publié: (2024)
Forking Paths in Neural Text Generation
par: Bigelow, Eric, et autres
Publié: (2024)
par: Bigelow, Eric, et autres
Publié: (2024)
Policy-Gradient Training of Language Models for Ranking
par: Gao, Ge, et autres
Publié: (2023)
par: Gao, Ge, et autres
Publié: (2023)
Beyond LLM-as-a-Judge: Deterministic Metrics for Multilingual Generative Text Evaluation
par: Alam, Firoj, et autres
Publié: (2026)
par: Alam, Firoj, et autres
Publié: (2026)
Beyond Scalar Reward Model: Learning Generative Judge from Preference Data
par: Ye, Ziyi, et autres
Publié: (2024)
par: Ye, Ziyi, et autres
Publié: (2024)
Training and Evaluating Language Models with Template-based Data Generation
par: Zhang, Yifan
Publié: (2024)
par: Zhang, Yifan
Publié: (2024)
Post-training an LLM for RAG? Train on Self-Generated Demonstrations
par: Finlayson, Matthew, et autres
Publié: (2025)
par: Finlayson, Matthew, et autres
Publié: (2025)
Knowledge Boundary Discovery for Large Language Models
par: Wang, Ziquan, et autres
Publié: (2026)
par: Wang, Ziquan, et autres
Publié: (2026)
Executable Functional Abstractions: Inferring Generative Programs for Advanced Math Problems
par: Khan, Zaid, et autres
Publié: (2025)
par: Khan, Zaid, et autres
Publié: (2025)
Phrase-Level Adversarial Training for Mitigating Bias in Neural Network-based Automatic Essay Scoring
par: Philip, Haddad, et autres
Publié: (2024)
par: Philip, Haddad, et autres
Publié: (2024)
Documents similaires
-
Analyzing Generalization in Pre-Trained Symbolic Regression
par: Voigt, Henrik, et autres
Publié: (2025) -
Scaling Up Unbiased Search-based Symbolic Regression
par: Kahlmeyer, Paul, et autres
Publié: (2025) -
Neural Task Synthesis for Visual Programming
par: Pădurean, Victor-Alexandru, et autres
Publié: (2023) -
In-context Pretraining: Language Modeling Beyond Document Boundaries
par: Shi, Weijia, et autres
Publié: (2023) -
Generating Pragmatic Examples to Train Neural Program Synthesizers
par: Vaduguru, Saujas, et autres
Publié: (2023)