Enregistré dans:
| Auteurs principaux: | Mei, Jincheng, Osband, Ian |
|---|---|
| Format: | Preprint |
| Publié: |
2026
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2605.11908 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
Delightful Policy Gradient
par: Osband, Ian
Publié: (2026)
par: Osband, Ian
Publié: (2026)
Delightful Distributed Policy Gradient
par: Osband, Ian
Publié: (2026)
par: Osband, Ian
Publié: (2026)
Delightful Exploration
par: Osband, Ian
Publié: (2026)
par: Osband, Ian
Publié: (2026)
Does This Gradient Spark Joy?
par: Osband, Ian
Publié: (2026)
par: Osband, Ian
Publié: (2026)
Corner Gradient Descent
par: Yarotsky, Dmitry
Publié: (2025)
par: Yarotsky, Dmitry
Publié: (2025)
An Accelerated Gradient Method for Convex Smooth Simple Bilevel Optimization
par: Cao, Jincheng, et autres
Publié: (2024)
par: Cao, Jincheng, et autres
Publié: (2024)
Stochastic Gradient Succeeds for Bandits
par: Mei, Jincheng, et autres
Publié: (2024)
par: Mei, Jincheng, et autres
Publié: (2024)
Ordering-based Conditions for Global Convergence of Policy Gradient Methods
par: Mei, Jincheng, et autres
Publié: (2025)
par: Mei, Jincheng, et autres
Publié: (2025)
Faster WIND: Accelerating Iterative Best-of-$N$ Distillation for LLM Alignment
par: Yang, Tong, et autres
Publié: (2024)
par: Yang, Tong, et autres
Publié: (2024)
Revisiting Policy Gradients for Restricted Policy Classes: Escaping Myopic Local Optima with $k$-step Policy Gradients
par: DeWeese, Alex, et autres
Publié: (2026)
par: DeWeese, Alex, et autres
Publié: (2026)
Rethinking the Global Convergence of Softmax Policy Gradient with Linear Function Approximation
par: Lin, Max Qiushi, et autres
Publié: (2025)
par: Lin, Max Qiushi, et autres
Publié: (2025)
Hessian-guided Perturbed Wasserstein Gradient Flows for Escaping Saddle Points
par: Yamamoto, Naoya, et autres
Publié: (2025)
par: Yamamoto, Naoya, et autres
Publié: (2025)
Stacking as Accelerated Gradient Descent
par: Agarwal, Naman, et autres
Publié: (2024)
par: Agarwal, Naman, et autres
Publié: (2024)
Revisiting Mixture Policies in Entropy-Regularized Actor-Critic
par: He, Jiamin, et autres
Publié: (2026)
par: He, Jiamin, et autres
Publié: (2026)
Accelerated Gradient Descent for Faster Convergence with Minimal Overhead
par: Graca, Manuel, et autres
Publié: (2026)
par: Graca, Manuel, et autres
Publié: (2026)
Teleportation With Null Space Gradient Projection for Optimization Acceleration
par: Wu, Zihao, et autres
Publié: (2025)
par: Wu, Zihao, et autres
Publié: (2025)
Anytime Acceleration of Gradient Descent
par: Zhang, Zihan, et autres
Publié: (2024)
par: Zhang, Zihan, et autres
Publié: (2024)
Dimension-Free Saddle-Point Escape in Muon
par: Long, Yanlin, et autres
Publié: (2026)
par: Long, Yanlin, et autres
Publié: (2026)
On the Escaping Efficiency of Distributed Adversarial Training Algorithms
par: Cao, Ying, et autres
Publié: (2025)
par: Cao, Ying, et autres
Publié: (2025)
Description of Corner Cases in Automated Driving: Goals and Challenges
par: Bogdoll, Daniel, et autres
Publié: (2021)
par: Bogdoll, Daniel, et autres
Publié: (2021)
Grokfast: Accelerated Grokking by Amplifying Slow Gradients
par: Lee, Jaerin, et autres
Publié: (2024)
par: Lee, Jaerin, et autres
Publié: (2024)
Streaming Krylov-Accelerated Stochastic Gradient Descent
par: Thomas, Stephen
Publié: (2025)
par: Thomas, Stephen
Publié: (2025)
Preconditioning for Accelerated Gradient Descent Optimization and Regularization
par: Ye, Qiang
Publié: (2024)
par: Ye, Qiang
Publié: (2024)
Large Stepsizes Accelerate Gradient Descent for Regularized Logistic Regression
par: Wu, Jingfeng, et autres
Publié: (2025)
par: Wu, Jingfeng, et autres
Publié: (2025)
Egalitarian Gradient Descent: A Simple Approach to Accelerated Grokking
par: Pasand, Ali Saheb, et autres
Publié: (2025)
par: Pasand, Ali Saheb, et autres
Publié: (2025)
QOG:Question and Options Generation based on Language Model
par: Zhou, Jincheng
Publié: (2024)
par: Zhou, Jincheng
Publié: (2024)
Small steps no more: Global convergence of stochastic gradient bandits for arbitrary learning rates
par: Mei, Jincheng, et autres
Publié: (2025)
par: Mei, Jincheng, et autres
Publié: (2025)
Accelerated Multiple Wasserstein Gradient Flows for Multi-objective Distributional Optimization
par: Nguyen, Dai Hai, et autres
Publié: (2026)
par: Nguyen, Dai Hai, et autres
Publié: (2026)
Accelerated Policy Gradient: On the Convergence Rates of the Nesterov Momentum for Reinforcement Learning
par: Chen, Yen-Ju, et autres
Publié: (2023)
par: Chen, Yen-Ju, et autres
Publié: (2023)
Accelerating Convergence of Stein Variational Gradient Descent via Deep Unfolding
par: Kawamura, Yuya, et autres
Publié: (2024)
par: Kawamura, Yuya, et autres
Publié: (2024)
Accelerated Training through Iterative Gradient Propagation Along the Residual Path
par: Fagnou, Erwan, et autres
Publié: (2025)
par: Fagnou, Erwan, et autres
Publié: (2025)
Provable Acceleration of Nesterov's Accelerated Gradient for Rectangular Matrix Factorization and Linear Neural Networks
par: Xu, Zhenghao, et autres
Publié: (2024)
par: Xu, Zhenghao, et autres
Publié: (2024)
Communication-Efficient Federated Learning with Accelerated Client Gradient
par: Kim, Geeho, et autres
Publié: (2022)
par: Kim, Geeho, et autres
Publié: (2022)
NeuralGrok: Accelerate Grokking by Neural Gradient Transformation
par: Zhou, Xinyu, et autres
Publié: (2025)
par: Zhou, Xinyu, et autres
Publié: (2025)
Escaping Local Optima in Global Placement
par: Xue, Ke, et autres
Publié: (2024)
par: Xue, Ke, et autres
Publié: (2024)
Accelerated Gradient Methods for Nonconvex Optimization: Escape Trajectories From Strict Saddle Points and Convergence to Local Minima
par: Dixit, Rishabh, et autres
Publié: (2023)
par: Dixit, Rishabh, et autres
Publié: (2023)
Escaping the Verifier: Learning to Reason via Demonstrations
par: Cai, Locke, et autres
Publié: (2025)
par: Cai, Locke, et autres
Publié: (2025)
Improving Infinitely Deep Bayesian Neural Networks with Nesterov's Accelerated Gradient Method
par: Yu, Chenxu, et autres
Publié: (2026)
par: Yu, Chenxu, et autres
Publié: (2026)
Accelerating LMO-Based Optimization via Implicit Gradient Transport
par: Jang, Won-Jun, et autres
Publié: (2026)
par: Jang, Won-Jun, et autres
Publié: (2026)
Accelerated Stochastic ExtraGradient: Mixing Hessian and Gradient Similarity to Reduce Communication in Distributed and Federated Learning
par: Bylinkin, Dmitry, et autres
Publié: (2024)
par: Bylinkin, Dmitry, et autres
Publié: (2024)
Documents similaires
-
Delightful Policy Gradient
par: Osband, Ian
Publié: (2026) -
Delightful Distributed Policy Gradient
par: Osband, Ian
Publié: (2026) -
Delightful Exploration
par: Osband, Ian
Publié: (2026) -
Does This Gradient Spark Joy?
par: Osband, Ian
Publié: (2026) -
Corner Gradient Descent
par: Yarotsky, Dmitry
Publié: (2025)