:: Library Catalog

Image de couverture de livre

Enregistré dans:

Détails bibliographiques
Auteurs principaux:	Mei, Jincheng, Osband, Ian
Format:	Preprint
Publié:	2026
Sujets:	Machine Learning
Accès en ligne:	https://arxiv.org/abs/2605.11908
Tags:	Ajouter un tag Pas de tags, Soyez le premier à ajouter un tag!

Documents similaires

Delightful Policy Gradient
par: Osband, Ian
Publié: (2026)

Delightful Distributed Policy Gradient
par: Osband, Ian
Publié: (2026)

Delightful Exploration
par: Osband, Ian
Publié: (2026)

Does This Gradient Spark Joy?
par: Osband, Ian
Publié: (2026)

Corner Gradient Descent
par: Yarotsky, Dmitry
Publié: (2025)

An Accelerated Gradient Method for Convex Smooth Simple Bilevel Optimization
par: Cao, Jincheng, et autres
Publié: (2024)

Stochastic Gradient Succeeds for Bandits
par: Mei, Jincheng, et autres
Publié: (2024)

Ordering-based Conditions for Global Convergence of Policy Gradient Methods
par: Mei, Jincheng, et autres
Publié: (2025)

Faster WIND: Accelerating Iterative Best-of-$N$ Distillation for LLM Alignment
par: Yang, Tong, et autres
Publié: (2024)

Revisiting Policy Gradients for Restricted Policy Classes: Escaping Myopic Local Optima with $k$-step Policy Gradients
par: DeWeese, Alex, et autres
Publié: (2026)

Rethinking the Global Convergence of Softmax Policy Gradient with Linear Function Approximation
par: Lin, Max Qiushi, et autres
Publié: (2025)

Hessian-guided Perturbed Wasserstein Gradient Flows for Escaping Saddle Points
par: Yamamoto, Naoya, et autres
Publié: (2025)

Stacking as Accelerated Gradient Descent
par: Agarwal, Naman, et autres
Publié: (2024)

Revisiting Mixture Policies in Entropy-Regularized Actor-Critic
par: He, Jiamin, et autres
Publié: (2026)

Accelerated Gradient Descent for Faster Convergence with Minimal Overhead
par: Graca, Manuel, et autres
Publié: (2026)

Teleportation With Null Space Gradient Projection for Optimization Acceleration
par: Wu, Zihao, et autres
Publié: (2025)

Anytime Acceleration of Gradient Descent
par: Zhang, Zihan, et autres
Publié: (2024)

Dimension-Free Saddle-Point Escape in Muon
par: Long, Yanlin, et autres
Publié: (2026)

On the Escaping Efficiency of Distributed Adversarial Training Algorithms
par: Cao, Ying, et autres
Publié: (2025)

Description of Corner Cases in Automated Driving: Goals and Challenges
par: Bogdoll, Daniel, et autres
Publié: (2021)

Grokfast: Accelerated Grokking by Amplifying Slow Gradients
par: Lee, Jaerin, et autres
Publié: (2024)

Streaming Krylov-Accelerated Stochastic Gradient Descent
par: Thomas, Stephen
Publié: (2025)

Preconditioning for Accelerated Gradient Descent Optimization and Regularization
par: Ye, Qiang
Publié: (2024)

Large Stepsizes Accelerate Gradient Descent for Regularized Logistic Regression
par: Wu, Jingfeng, et autres
Publié: (2025)

Egalitarian Gradient Descent: A Simple Approach to Accelerated Grokking
par: Pasand, Ali Saheb, et autres
Publié: (2025)

QOG:Question and Options Generation based on Language Model
par: Zhou, Jincheng
Publié: (2024)

Small steps no more: Global convergence of stochastic gradient bandits for arbitrary learning rates
par: Mei, Jincheng, et autres
Publié: (2025)

Accelerated Multiple Wasserstein Gradient Flows for Multi-objective Distributional Optimization
par: Nguyen, Dai Hai, et autres
Publié: (2026)

Accelerated Policy Gradient: On the Convergence Rates of the Nesterov Momentum for Reinforcement Learning
par: Chen, Yen-Ju, et autres
Publié: (2023)

Accelerating Convergence of Stein Variational Gradient Descent via Deep Unfolding
par: Kawamura, Yuya, et autres
Publié: (2024)

Accelerated Training through Iterative Gradient Propagation Along the Residual Path
par: Fagnou, Erwan, et autres
Publié: (2025)

Provable Acceleration of Nesterov's Accelerated Gradient for Rectangular Matrix Factorization and Linear Neural Networks
par: Xu, Zhenghao, et autres
Publié: (2024)

Communication-Efficient Federated Learning with Accelerated Client Gradient
par: Kim, Geeho, et autres
Publié: (2022)

NeuralGrok: Accelerate Grokking by Neural Gradient Transformation
par: Zhou, Xinyu, et autres
Publié: (2025)

Escaping Local Optima in Global Placement
par: Xue, Ke, et autres
Publié: (2024)

Accelerated Gradient Methods for Nonconvex Optimization: Escape Trajectories From Strict Saddle Points and Convergence to Local Minima
par: Dixit, Rishabh, et autres
Publié: (2023)

Escaping the Verifier: Learning to Reason via Demonstrations
par: Cai, Locke, et autres
Publié: (2025)

Improving Infinitely Deep Bayesian Neural Networks with Nesterov's Accelerated Gradient Method
par: Yu, Chenxu, et autres
Publié: (2026)

Accelerating LMO-Based Optimization via Implicit Gradient Transport
par: Jang, Won-Jun, et autres
Publié: (2026)

Accelerated Stochastic ExtraGradient: Mixing Hessian and Gradient Similarity to Reduce Communication in Distributed and Federated Learning
par: Bylinkin, Dmitry, et autres
Publié: (2024)