Salvato in:
| Autori principali: | Zhang, Haobin, Yang, Zhuang |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2024
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2405.12228 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
Accelerated Policy Gradient: On the Convergence Rates of the Nesterov Momentum for Reinforcement Learning
di: Chen, Yen-Ju, et al.
Pubblicazione: (2023)
di: Chen, Yen-Ju, et al.
Pubblicazione: (2023)
On the Generalization of Stochastic Gradient Descent with Momentum
di: Ramezani-Kebrya, Ali, et al.
Pubblicazione: (2018)
di: Ramezani-Kebrya, Ali, et al.
Pubblicazione: (2018)
Stochastic Gradient Descent with Momentum is Algorithmically Stable
di: Lei, Yunwen, et al.
Pubblicazione: (2026)
di: Lei, Yunwen, et al.
Pubblicazione: (2026)
Momentum Does Not Reduce Stochastic Noise in Stochastic Gradient Descent
di: Sato, Naoki, et al.
Pubblicazione: (2024)
di: Sato, Naoki, et al.
Pubblicazione: (2024)
Learning Optimal Deterministic Policies with Stochastic Policy Gradients
di: Montenegro, Alessandro, et al.
Pubblicazione: (2024)
di: Montenegro, Alessandro, et al.
Pubblicazione: (2024)
Fast Two-Time-Scale Stochastic Gradient Method with Applications in Reinforcement Learning
di: Zeng, Sihan, et al.
Pubblicazione: (2024)
di: Zeng, Sihan, et al.
Pubblicazione: (2024)
Policy Gradient with Second Order Momentum
di: Sun, Tianyu
Pubblicazione: (2025)
di: Sun, Tianyu
Pubblicazione: (2025)
Model-free Reinforcement Learning of Semantic Communication by Stochastic Policy Gradient
di: Beck, Edgar, et al.
Pubblicazione: (2023)
di: Beck, Edgar, et al.
Pubblicazione: (2023)
Stochastic Normalized Gradient Descent with Momentum for Large-Batch Training
di: Zhao, Shen-Yi, et al.
Pubblicazione: (2020)
di: Zhao, Shen-Yi, et al.
Pubblicazione: (2020)
On-Policy Policy Gradient Reinforcement Learning Without On-Policy Sampling
di: Corrado, Nicholas E., et al.
Pubblicazione: (2023)
di: Corrado, Nicholas E., et al.
Pubblicazione: (2023)
Dynamic Momentum Recalibration in Online Gradient Learning
di: Yao, Zhipeng, et al.
Pubblicazione: (2026)
di: Yao, Zhipeng, et al.
Pubblicazione: (2026)
Increasing Batch Size Improves Convergence of Stochastic Gradient Descent with Momentum
di: Kamo, Keisuke, et al.
Pubblicazione: (2025)
di: Kamo, Keisuke, et al.
Pubblicazione: (2025)
Compressed Decentralized Momentum Stochastic Gradient Methods for Nonconvex Optimization
di: Liu, Wei, et al.
Pubblicazione: (2025)
di: Liu, Wei, et al.
Pubblicazione: (2025)
Explainable Learning Rate Regimes for Stochastic Optimization
di: Yang, Zhuang
Pubblicazione: (2025)
di: Yang, Zhuang
Pubblicazione: (2025)
Rapid Learning in Constrained Minimax Games with Negative Momentum
di: Fang, Zijian, et al.
Pubblicazione: (2024)
di: Fang, Zijian, et al.
Pubblicazione: (2024)
Momentum Contrastive Learning with Enhanced Negative Sampling and Hard Negative Filtering
di: Hoang, Duy, et al.
Pubblicazione: (2025)
di: Hoang, Duy, et al.
Pubblicazione: (2025)
First and Second Order Approximations to Stochastic Gradient Descent Methods with Momentum Terms
di: Lu, Eric
Pubblicazione: (2025)
di: Lu, Eric
Pubblicazione: (2025)
Measuring Learning Progress via Gradient-Momentum Coupling
di: Blad, Samuel, et al.
Pubblicazione: (2026)
di: Blad, Samuel, et al.
Pubblicazione: (2026)
Beyond Exact Gradients: Convergence of Stochastic Soft-Max Policy Gradient Methods with Entropy Regularization
di: Ding, Yuhao, et al.
Pubblicazione: (2021)
di: Ding, Yuhao, et al.
Pubblicazione: (2021)
Policy Gradients for Cumulative Prospect Theory in Reinforcement Learning
di: Lepel, Olivier, et al.
Pubblicazione: (2024)
di: Lepel, Olivier, et al.
Pubblicazione: (2024)
Policy Gradient Methods for Non-Markovian Reinforcement Learning
di: Kar, Avik, et al.
Pubblicazione: (2026)
di: Kar, Avik, et al.
Pubblicazione: (2026)
Algorithmic Stability of Stochastic Gradient Descent with Momentum under Heavy-Tailed Noise
di: Dang, Thanh, et al.
Pubblicazione: (2025)
di: Dang, Thanh, et al.
Pubblicazione: (2025)
Deterministic Policy Gradient for Reinforcement Learning with Continuous Time and State
di: Cheng, Ziheng, et al.
Pubblicazione: (2025)
di: Cheng, Ziheng, et al.
Pubblicazione: (2025)
Global Convergence of Natural Policy Gradient with Hessian-aided Momentum Variance Reduction
di: Feng, Jie, et al.
Pubblicazione: (2024)
di: Feng, Jie, et al.
Pubblicazione: (2024)
Cheap Bootstrap for Fast Uncertainty Quantification of Stochastic Gradient Descent
di: Lam, Henry, et al.
Pubblicazione: (2023)
di: Lam, Henry, et al.
Pubblicazione: (2023)
Reusing Trajectories in Policy Gradients Enables Fast Convergence
di: Montenegro, Alessandro, et al.
Pubblicazione: (2025)
di: Montenegro, Alessandro, et al.
Pubblicazione: (2025)
LPPG-RL: Lexicographically Projected Policy Gradient Reinforcement Learning with Subproblem Exploration
di: Qiu, Ruiyu, et al.
Pubblicazione: (2025)
di: Qiu, Ruiyu, et al.
Pubblicazione: (2025)
Last-Iterate Global Convergence of Policy Gradients for Constrained Reinforcement Learning
di: Montenegro, Alessandro, et al.
Pubblicazione: (2024)
di: Montenegro, Alessandro, et al.
Pubblicazione: (2024)
Global Convergence of Wasserstein Policy Gradient for Entropy-Regularized Reinforcement Learning
di: Zhu, Zhaoyu, et al.
Pubblicazione: (2026)
di: Zhu, Zhaoyu, et al.
Pubblicazione: (2026)
A Bias-Correction Decentralized Stochastic Gradient Algorithm with Momentum Acceleration
di: Hu, Yuchen, et al.
Pubblicazione: (2025)
di: Hu, Yuchen, et al.
Pubblicazione: (2025)
Zeroth-Order Policy Gradient for Reinforcement Learning from Human Feedback without Reward Inference
di: Zhang, Qining, et al.
Pubblicazione: (2024)
di: Zhang, Qining, et al.
Pubblicazione: (2024)
Emergence of Exploration in Policy Gradient Reinforcement Learning via Retrying
di: Nishimori, Soichiro, et al.
Pubblicazione: (2026)
di: Nishimori, Soichiro, et al.
Pubblicazione: (2026)
$K$-Level Policy Gradients for Multi-Agent Reinforcement Learning
di: Reddi, Aryaman, et al.
Pubblicazione: (2025)
di: Reddi, Aryaman, et al.
Pubblicazione: (2025)
Proximal Policy Gradient Arborescence for Quality Diversity Reinforcement Learning
di: Batra, Sumeet, et al.
Pubblicazione: (2023)
di: Batra, Sumeet, et al.
Pubblicazione: (2023)
On the Effect of Negative Gradient in Group Relative Deep Reinforcement Optimization
di: Deng, Wenlong, et al.
Pubblicazione: (2025)
di: Deng, Wenlong, et al.
Pubblicazione: (2025)
A Lyapunov Analysis of Softmax Policy Gradient for Stochastic Bandits
di: Lattimore, Tor
Pubblicazione: (2026)
di: Lattimore, Tor
Pubblicazione: (2026)
PSMGD: Periodic Stochastic Multi-Gradient Descent for Fast Multi-Objective Optimization
di: Xu, Mingjing, et al.
Pubblicazione: (2024)
di: Xu, Mingjing, et al.
Pubblicazione: (2024)
Performative Policy Gradient: Optimality in Performative Reinforcement Learning
di: Basu, Debabrota, et al.
Pubblicazione: (2025)
di: Basu, Debabrota, et al.
Pubblicazione: (2025)
Reinforcement Learning Friendly Vision-Language Model for Minecraft
di: Jiang, Haobin, et al.
Pubblicazione: (2023)
di: Jiang, Haobin, et al.
Pubblicazione: (2023)
Accuracy of Discretely Sampled Stochastic Policies in Continuous-time Reinforcement Learning
di: Jia, Yanwei, et al.
Pubblicazione: (2025)
di: Jia, Yanwei, et al.
Pubblicazione: (2025)
Documenti analoghi
-
Accelerated Policy Gradient: On the Convergence Rates of the Nesterov Momentum for Reinforcement Learning
di: Chen, Yen-Ju, et al.
Pubblicazione: (2023) -
On the Generalization of Stochastic Gradient Descent with Momentum
di: Ramezani-Kebrya, Ali, et al.
Pubblicazione: (2018) -
Stochastic Gradient Descent with Momentum is Algorithmically Stable
di: Lei, Yunwen, et al.
Pubblicazione: (2026) -
Momentum Does Not Reduce Stochastic Noise in Stochastic Gradient Descent
di: Sato, Naoki, et al.
Pubblicazione: (2024) -
Learning Optimal Deterministic Policies with Stochastic Policy Gradients
di: Montenegro, Alessandro, et al.
Pubblicazione: (2024)