Enregistré dans:
| Auteurs principaux: | Houliston, Sam, Odonnat, Ambroise, Arnal, Charles, Cabannes, Vivien |
|---|---|
| Format: | Preprint |
| Publié: |
2025
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2508.20755 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
Touring sampling with pushforward maps
par: Cabannes, Vivien, et autres
Publié: (2023)
par: Cabannes, Vivien, et autres
Publié: (2023)
Clustering Head: A Visual Case Study of the Training Dynamics in Transformers
par: Odonnat, Ambroise, et autres
Publié: (2024)
par: Odonnat, Ambroise, et autres
Publié: (2024)
Easing Optimization Paths: a Circuit Perspective
par: Odonnat, Ambroise, et autres
Publié: (2025)
par: Odonnat, Ambroise, et autres
Publié: (2025)
Learning with Hidden Factorial Structure
par: Arnal, Charles, et autres
Publié: (2024)
par: Arnal, Charles, et autres
Publié: (2024)
Optimal Self-Consistency for Efficient Reasoning with Large Language Models
par: Feng, Austin, et autres
Publié: (2025)
par: Feng, Austin, et autres
Publié: (2025)
Leveraging Ensemble Diversity for Robust Self-Training in the Presence of Sample Selection Bias
par: Odonnat, Ambroise, et autres
Publié: (2023)
par: Odonnat, Ambroise, et autres
Publié: (2023)
Iteration Head: A Mechanistic Study of Chain-of-Thought
par: Cabannes, Vivien, et autres
Publié: (2024)
par: Cabannes, Vivien, et autres
Publié: (2024)
Large Language Models as Markov Chains
par: Zekri, Oussama, et autres
Publié: (2024)
par: Zekri, Oussama, et autres
Publié: (2024)
The Galerkin method beats Graph-Based Approaches for Spectral Algorithms
par: Cabannes, Vivien, et autres
Publié: (2023)
par: Cabannes, Vivien, et autres
Publié: (2023)
Learning Associative Memories with Gradient Descent
par: Cabannes, Vivien, et autres
Publié: (2024)
par: Cabannes, Vivien, et autres
Publié: (2024)
Mode Estimation with Partial Feedback
par: Arnal, Charles, et autres
Publié: (2024)
par: Arnal, Charles, et autres
Publié: (2024)
Efficient RL Training for LLMs with Experience Replay
par: Arnal, Charles, et autres
Publié: (2026)
par: Arnal, Charles, et autres
Publié: (2026)
CauKer: Classification Time Series Foundation Models Can Be Pretrained on Synthetic Data
par: Xie, Shifeng, et autres
Publié: (2025)
par: Xie, Shifeng, et autres
Publié: (2025)
Scaling Laws for Associative Memories
par: Cabannes, Vivien, et autres
Publié: (2023)
par: Cabannes, Vivien, et autres
Publié: (2023)
Provable Benefit of Cutout and CutMix for Feature Learning
par: Oh, Junsoo, et autres
Publié: (2024)
par: Oh, Junsoo, et autres
Publié: (2024)
A Hierarchical Language Model with Predictable Scaling Laws and Provable Benefits of Reasoning
par: Gaitonde, Jason, et autres
Publié: (2026)
par: Gaitonde, Jason, et autres
Publié: (2026)
Uncertainty-Penalized Direct Preference Optimization
par: Houliston, Sam, et autres
Publié: (2024)
par: Houliston, Sam, et autres
Publié: (2024)
Vision Transformer Finetuning Benefits from Non-Smooth Components
par: Odonnat, Ambroise, et autres
Publié: (2026)
par: Odonnat, Ambroise, et autres
Publié: (2026)
Asymmetric REINFORCE for off-Policy Reinforcement Learning: Balancing positive and negative rewards
par: Arnal, Charles, et autres
Publié: (2025)
par: Arnal, Charles, et autres
Publié: (2025)
SKADA-Bench: Benchmarking Unsupervised Domain Adaptation Methods with Realistic Validation On Diverse Modalities
par: Lalou, Yanis, et autres
Publié: (2024)
par: Lalou, Yanis, et autres
Publié: (2024)
Provable Training Data Identification for Large Language Models
par: Liu, Zhenlong, et autres
Publié: (2025)
par: Liu, Zhenlong, et autres
Publié: (2025)
Provable Long-Range Benefits of Next-Token Prediction
par: Cao, Xinyuan, et autres
Publié: (2025)
par: Cao, Xinyuan, et autres
Publié: (2025)
Automatic Textbook Formalization
par: Gloeckle, Fabian, et autres
Publié: (2026)
par: Gloeckle, Fabian, et autres
Publié: (2026)
Provable Benefits of Complex Parameterizations for Structured State Space Models
par: Ran-Milo, Yuval, et autres
Publié: (2024)
par: Ran-Milo, Yuval, et autres
Publié: (2024)
Provable Benefit of Sign Descent: A Minimal Model Under Heavy-Tailed Class Imbalance
par: Yadav, Robin, et autres
Publié: (2025)
par: Yadav, Robin, et autres
Publié: (2025)
Metastable Dynamics of Chain-of-Thought Reasoning: Provable Benefits of Search, RL and Distillation
par: Kim, Juno, et autres
Publié: (2025)
par: Kim, Juno, et autres
Publié: (2025)
Unveiling Simplicities of Attention: Adaptive Long-Context Head Identification
par: Donhauser, Konstantin, et autres
Publié: (2025)
par: Donhauser, Konstantin, et autres
Publié: (2025)
Provable Scaling Laws for the Test-Time Compute of Large Language Models
par: Chen, Yanxi, et autres
Publié: (2024)
par: Chen, Yanxi, et autres
Publié: (2024)
Provably Robust Adaptation for Language-Empowered Foundation Models
par: Lai, Yuni, et autres
Publié: (2025)
par: Lai, Yuni, et autres
Publié: (2025)
Formalizing Mathematics at Scale
par: Rammal, Ahmad, et autres
Publié: (2026)
par: Rammal, Ahmad, et autres
Publié: (2026)
Explaining Machine Learning Predictive Models through Conditional Expectation Methods
par: Ruiz-España, Silvia, et autres
Publié: (2026)
par: Ruiz-España, Silvia, et autres
Publié: (2026)
Large Language Models as Tool Makers
par: Cai, Tianle, et autres
Publié: (2023)
par: Cai, Tianle, et autres
Publié: (2023)
Aligning Agents like Large Language Models
par: Jelley, Adam, et autres
Publié: (2024)
par: Jelley, Adam, et autres
Publié: (2024)
Dynamic Model Predictive Shielding for Provably Safe Reinforcement Learning
par: Banerjee, Arko, et autres
Publié: (2024)
par: Banerjee, Arko, et autres
Publié: (2024)
Unified Vision-Language Modeling via Concept Space Alignment
par: Qiu, Yifu, et autres
Publié: (2026)
par: Qiu, Yifu, et autres
Publié: (2026)
Compositional Risk Minimization
par: Mahajan, Divyat, et autres
Publié: (2024)
par: Mahajan, Divyat, et autres
Publié: (2024)
Joint Embedding vs Reconstruction: Provable Benefits of Latent Space Prediction for Self Supervised Learning
par: Van Assel, Hugues, et autres
Publié: (2025)
par: Van Assel, Hugues, et autres
Publié: (2025)
LoRA-One: One-Step Full Gradient Could Suffice for Fine-Tuning Large Language Models, Provably and Efficiently
par: Zhang, Yuanhe, et autres
Publié: (2025)
par: Zhang, Yuanhe, et autres
Publié: (2025)
Provably Learning Diffusion Models under the Manifold Hypothesis: Collapse and Refine
par: Huang, Wei, et autres
Publié: (2026)
par: Huang, Wei, et autres
Publié: (2026)
OR-Toolformer: Modeling and Solving Operations Research Problems with Tool Augmented Large Language Models
par: Zhang, Jianzhang, et autres
Publié: (2025)
par: Zhang, Jianzhang, et autres
Publié: (2025)
Documents similaires
-
Touring sampling with pushforward maps
par: Cabannes, Vivien, et autres
Publié: (2023) -
Clustering Head: A Visual Case Study of the Training Dynamics in Transformers
par: Odonnat, Ambroise, et autres
Publié: (2024) -
Easing Optimization Paths: a Circuit Perspective
par: Odonnat, Ambroise, et autres
Publié: (2025) -
Learning with Hidden Factorial Structure
par: Arnal, Charles, et autres
Publié: (2024) -
Optimal Self-Consistency for Efficient Reasoning with Large Language Models
par: Feng, Austin, et autres
Publié: (2025)