Enregistré dans:
| Auteurs principaux: | Balasubramanian, Aanand, Silwal, Sashank |
|---|---|
| Format: | Preprint |
| Publié: |
2026
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2601.10987 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
Interpretable Syntactic Representations Enable Hierarchical Word Vectors
par: Silwal, Biraj
Publié: (2024)
par: Silwal, Biraj
Publié: (2024)
Efficient Training-Free Online Routing for High-Volume Multi-LLM Serving
par: Wu, Fangzhou, et autres
Publié: (2025)
par: Wu, Fangzhou, et autres
Publié: (2025)
Understanding the Countably Infinite: Neural Network Models of the Successor Function and its Acquisition
par: Gupta, Vima, et autres
Publié: (2023)
par: Gupta, Vima, et autres
Publié: (2023)
Automated Program Repair: Emerging trends pose and expose problems for benchmarks
par: Renzullo, Joseph, et autres
Publié: (2024)
par: Renzullo, Joseph, et autres
Publié: (2024)
Randomization Boosts KV Caching, Learning Balances Query Load: A Joint Perspective
par: Wu, Fangzhou, et autres
Publié: (2026)
par: Wu, Fangzhou, et autres
Publié: (2026)
Capturing LLM Capabilities via Evidence-Calibrated Query Clustering
par: Wu, Fangzhou, et autres
Publié: (2026)
par: Wu, Fangzhou, et autres
Publié: (2026)
Reasoning with Latent Thoughts: On the Power of Looped Transformers
par: Saunshi, Nikunj, et autres
Publié: (2025)
par: Saunshi, Nikunj, et autres
Publié: (2025)
The Impact of Fine-tuning Large Language Models on Automated Program Repair
par: Macháček, Roman, et autres
Publié: (2025)
par: Macháček, Roman, et autres
Publié: (2025)
RepairBench: Leaderboard of Frontier Models for Program Repair
par: Silva, André, et autres
Publié: (2024)
par: Silva, André, et autres
Publié: (2024)
T-REX: Vision-Based System for Autonomous Leaf Detection and Grasp Estimation
par: Selvam, Srecharan, et autres
Publié: (2025)
par: Selvam, Srecharan, et autres
Publié: (2025)
On the Inductive Bias of Stacking Towards Improving Reasoning
par: Saunshi, Nikunj, et autres
Publié: (2024)
par: Saunshi, Nikunj, et autres
Publié: (2024)
Beyond Worst-Case Dimensionality Reduction for Sparse Vectors
par: Silwal, Sandeep, et autres
Publié: (2025)
par: Silwal, Sandeep, et autres
Publié: (2025)
A Bi-metric Framework for Fast Similarity Search
par: Xu, Haike, et autres
Publié: (2024)
par: Xu, Haike, et autres
Publié: (2024)
DynMuon: A Dynamic Spectral Shaping View of Muon
par: Wu, Fangzhou, et autres
Publié: (2026)
par: Wu, Fangzhou, et autres
Publié: (2026)
Are More Tokens Rational? Inference-Time Scaling in Language Models as Adaptive Resource Rationality
par: Hu, Zhimin, et autres
Publié: (2026)
par: Hu, Zhimin, et autres
Publié: (2026)
Optimal Algorithms for Augmented Testing of Discrete Distributions
par: Aliakbarpour, Maryam, et autres
Publié: (2024)
par: Aliakbarpour, Maryam, et autres
Publié: (2024)
RepairLLaMA: Efficient Representations and Fine-Tuned Adapters for Program Repair
par: Silva, André, et autres
Publié: (2023)
par: Silva, André, et autres
Publié: (2023)
Assessing the Latent Automated Program Repair Capabilities of Large Language Models using Round-Trip Translation
par: Ruiz, Fernando Vallecillos, et autres
Publié: (2024)
par: Ruiz, Fernando Vallecillos, et autres
Publié: (2024)
Structured Preconditioners in Adaptive Optimization: A Unified Analysis
par: Xie, Shuo, et autres
Publié: (2025)
par: Xie, Shuo, et autres
Publié: (2025)
A Neural Network Model of Complementary Learning Systems: Pattern Separation and Completion for Continual Learning
par: Jun, James P, et autres
Publié: (2025)
par: Jun, James P, et autres
Publié: (2025)
Distilling Lightweight Domain Experts from Large ML Models by Identifying Relevant Subspaces
par: Chormai, Pattarawat, et autres
Publié: (2026)
par: Chormai, Pattarawat, et autres
Publié: (2026)
Pushing the Limits of Distillation-Based Continual Learning via Classifier-Proximal Lightweight Plugins
par: Xu, Zhiming, et autres
Publié: (2025)
par: Xu, Zhiming, et autres
Publié: (2025)
Pre-trained Language Model and Knowledge Distillation for Lightweight Sequential Recommendation
par: Li, Li, et autres
Publié: (2024)
par: Li, Li, et autres
Publié: (2024)
How fast can you find a good hypothesis?
par: Aamand, Anders, et autres
Publié: (2025)
par: Aamand, Anders, et autres
Publié: (2025)
Validity-Calibrated Reasoning Distillation
par: Saadi, Khouloud, et autres
Publié: (2026)
par: Saadi, Khouloud, et autres
Publié: (2026)
Physics-informed neural networks (PINNs) for numerical model error approximation and superresolution
par: Zhuang, Bozhou, et autres
Publié: (2024)
par: Zhuang, Bozhou, et autres
Publié: (2024)
Natural Mitigation of Catastrophic Interference: Continual Learning in Power-Law Learning Environments
par: Gandhi, Atith, et autres
Publié: (2024)
par: Gandhi, Atith, et autres
Publié: (2024)
Simplicity Bias via Global Convergence of Sharpness Minimization
par: Gatmiry, Khashayar, et autres
Publié: (2024)
par: Gatmiry, Khashayar, et autres
Publié: (2024)
Optimizing Parking Space Classification: Distilling Ensembles into Lightweight Classifiers
par: Alves, Paulo Luza, et autres
Publié: (2024)
par: Alves, Paulo Luza, et autres
Publié: (2024)
LBLLM: Lightweight Binarization of Large Language Models via Three-Stage Distillation
par: Song, Siqing, et autres
Publié: (2026)
par: Song, Siqing, et autres
Publié: (2026)
CigaR: Cost-efficient Program Repair with LLMs
par: Hidvégi, Dávid, et autres
Publié: (2024)
par: Hidvégi, Dávid, et autres
Publié: (2024)
Frequency-Aligned Knowledge Distillation for Lightweight Spatiotemporal Forecasting
par: Li, Yuqi, et autres
Publié: (2025)
par: Li, Yuqi, et autres
Publié: (2025)
Cobweb: An Incremental and Hierarchical Model of Human-Like Category Learning
par: Lian, Xin, et autres
Publié: (2024)
par: Lian, Xin, et autres
Publié: (2024)
Self-Distilled Reasoner: On-Policy Self-Distillation for Large Language Models
par: Zhao, Siyan, et autres
Publié: (2026)
par: Zhao, Siyan, et autres
Publié: (2026)
Self-Supervised On-Policy Distillation for Reasoning Language Models
par: Tan, Zhiquan, et autres
Publié: (2026)
par: Tan, Zhiquan, et autres
Publié: (2026)
Aligning the Objective of LLM-based Program Repair
par: Xu, Junjielong, et autres
Publié: (2024)
par: Xu, Junjielong, et autres
Publié: (2024)
The Art of Repair: Optimizing Iterative Program Repair with Instruction-Tuned Models
par: Ruiz, Fernando Vallecillos, et autres
Publié: (2025)
par: Ruiz, Fernando Vallecillos, et autres
Publié: (2025)
Gradient-Based Program Repair: Fixing Bugs in Continuous Program Spaces
par: Silva, André, et autres
Publié: (2025)
par: Silva, André, et autres
Publié: (2025)
Finite-Particle Convergence Rates for Conservative and Non-Conservative Drifting Models
par: Balasubramanian, Krishnakumar
Publié: (2026)
par: Balasubramanian, Krishnakumar
Publié: (2026)
Large-Step Training Dynamics of a Two-Factor Linear Transformer Model
par: Balasubramanian, Krishnakumar
Publié: (2026)
par: Balasubramanian, Krishnakumar
Publié: (2026)
Documents similaires
-
Interpretable Syntactic Representations Enable Hierarchical Word Vectors
par: Silwal, Biraj
Publié: (2024) -
Efficient Training-Free Online Routing for High-Volume Multi-LLM Serving
par: Wu, Fangzhou, et autres
Publié: (2025) -
Understanding the Countably Infinite: Neural Network Models of the Successor Function and its Acquisition
par: Gupta, Vima, et autres
Publié: (2023) -
Automated Program Repair: Emerging trends pose and expose problems for benchmarks
par: Renzullo, Joseph, et autres
Publié: (2024) -
Randomization Boosts KV Caching, Learning Balances Query Load: A Joint Perspective
par: Wu, Fangzhou, et autres
Publié: (2026)