:: Library Catalog

Image de couverture de livre

Enregistré dans:

Détails bibliographiques
Auteurs principaux:	Balasubramanian, Aanand, Silwal, Sashank
Format:	Preprint
Publié:	2026
Sujets:	Machine Learning
Accès en ligne:	https://arxiv.org/abs/2601.10987
Tags:	Ajouter un tag Pas de tags, Soyez le premier à ajouter un tag!

Documents similaires

Interpretable Syntactic Representations Enable Hierarchical Word Vectors
par: Silwal, Biraj
Publié: (2024)

Efficient Training-Free Online Routing for High-Volume Multi-LLM Serving
par: Wu, Fangzhou, et autres
Publié: (2025)

Understanding the Countably Infinite: Neural Network Models of the Successor Function and its Acquisition
par: Gupta, Vima, et autres
Publié: (2023)

Automated Program Repair: Emerging trends pose and expose problems for benchmarks
par: Renzullo, Joseph, et autres
Publié: (2024)

Randomization Boosts KV Caching, Learning Balances Query Load: A Joint Perspective
par: Wu, Fangzhou, et autres
Publié: (2026)

Capturing LLM Capabilities via Evidence-Calibrated Query Clustering
par: Wu, Fangzhou, et autres
Publié: (2026)

Reasoning with Latent Thoughts: On the Power of Looped Transformers
par: Saunshi, Nikunj, et autres
Publié: (2025)

The Impact of Fine-tuning Large Language Models on Automated Program Repair
par: Macháček, Roman, et autres
Publié: (2025)

RepairBench: Leaderboard of Frontier Models for Program Repair
par: Silva, André, et autres
Publié: (2024)

T-REX: Vision-Based System for Autonomous Leaf Detection and Grasp Estimation
par: Selvam, Srecharan, et autres
Publié: (2025)

On the Inductive Bias of Stacking Towards Improving Reasoning
par: Saunshi, Nikunj, et autres
Publié: (2024)

Beyond Worst-Case Dimensionality Reduction for Sparse Vectors
par: Silwal, Sandeep, et autres
Publié: (2025)

A Bi-metric Framework for Fast Similarity Search
par: Xu, Haike, et autres
Publié: (2024)

DynMuon: A Dynamic Spectral Shaping View of Muon
par: Wu, Fangzhou, et autres
Publié: (2026)

Are More Tokens Rational? Inference-Time Scaling in Language Models as Adaptive Resource Rationality
par: Hu, Zhimin, et autres
Publié: (2026)

Optimal Algorithms for Augmented Testing of Discrete Distributions
par: Aliakbarpour, Maryam, et autres
Publié: (2024)

RepairLLaMA: Efficient Representations and Fine-Tuned Adapters for Program Repair
par: Silva, André, et autres
Publié: (2023)

Assessing the Latent Automated Program Repair Capabilities of Large Language Models using Round-Trip Translation
par: Ruiz, Fernando Vallecillos, et autres
Publié: (2024)

Structured Preconditioners in Adaptive Optimization: A Unified Analysis
par: Xie, Shuo, et autres
Publié: (2025)

A Neural Network Model of Complementary Learning Systems: Pattern Separation and Completion for Continual Learning
par: Jun, James P, et autres
Publié: (2025)

Distilling Lightweight Domain Experts from Large ML Models by Identifying Relevant Subspaces
par: Chormai, Pattarawat, et autres
Publié: (2026)

Pushing the Limits of Distillation-Based Continual Learning via Classifier-Proximal Lightweight Plugins
par: Xu, Zhiming, et autres
Publié: (2025)

Pre-trained Language Model and Knowledge Distillation for Lightweight Sequential Recommendation
par: Li, Li, et autres
Publié: (2024)

How fast can you find a good hypothesis?
par: Aamand, Anders, et autres
Publié: (2025)

Validity-Calibrated Reasoning Distillation
par: Saadi, Khouloud, et autres
Publié: (2026)

Physics-informed neural networks (PINNs) for numerical model error approximation and superresolution
par: Zhuang, Bozhou, et autres
Publié: (2024)

Natural Mitigation of Catastrophic Interference: Continual Learning in Power-Law Learning Environments
par: Gandhi, Atith, et autres
Publié: (2024)

Simplicity Bias via Global Convergence of Sharpness Minimization
par: Gatmiry, Khashayar, et autres
Publié: (2024)

Optimizing Parking Space Classification: Distilling Ensembles into Lightweight Classifiers
par: Alves, Paulo Luza, et autres
Publié: (2024)

LBLLM: Lightweight Binarization of Large Language Models via Three-Stage Distillation
par: Song, Siqing, et autres
Publié: (2026)

CigaR: Cost-efficient Program Repair with LLMs
par: Hidvégi, Dávid, et autres
Publié: (2024)

Frequency-Aligned Knowledge Distillation for Lightweight Spatiotemporal Forecasting
par: Li, Yuqi, et autres
Publié: (2025)

Cobweb: An Incremental and Hierarchical Model of Human-Like Category Learning
par: Lian, Xin, et autres
Publié: (2024)

Self-Distilled Reasoner: On-Policy Self-Distillation for Large Language Models
par: Zhao, Siyan, et autres
Publié: (2026)

Self-Supervised On-Policy Distillation for Reasoning Language Models
par: Tan, Zhiquan, et autres
Publié: (2026)

Aligning the Objective of LLM-based Program Repair
par: Xu, Junjielong, et autres
Publié: (2024)

The Art of Repair: Optimizing Iterative Program Repair with Instruction-Tuned Models
par: Ruiz, Fernando Vallecillos, et autres
Publié: (2025)

Gradient-Based Program Repair: Fixing Bugs in Continuous Program Spaces
par: Silva, André, et autres
Publié: (2025)

Finite-Particle Convergence Rates for Conservative and Non-Conservative Drifting Models
par: Balasubramanian, Krishnakumar
Publié: (2026)

Large-Step Training Dynamics of a Two-Factor Linear Transformer Model
par: Balasubramanian, Krishnakumar
Publié: (2026)