:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autori principali:	Zhang, Haobin, Yang, Zhuang
Natura:	Preprint
Pubblicazione:	2024
Soggetti:	Machine Learning
Accesso online:	https://arxiv.org/abs/2405.12228
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

Accelerated Policy Gradient: On the Convergence Rates of the Nesterov Momentum for Reinforcement Learning
di: Chen, Yen-Ju, et al.
Pubblicazione: (2023)

On the Generalization of Stochastic Gradient Descent with Momentum
di: Ramezani-Kebrya, Ali, et al.
Pubblicazione: (2018)

Stochastic Gradient Descent with Momentum is Algorithmically Stable
di: Lei, Yunwen, et al.
Pubblicazione: (2026)

Momentum Does Not Reduce Stochastic Noise in Stochastic Gradient Descent
di: Sato, Naoki, et al.
Pubblicazione: (2024)

Learning Optimal Deterministic Policies with Stochastic Policy Gradients
di: Montenegro, Alessandro, et al.
Pubblicazione: (2024)

Fast Two-Time-Scale Stochastic Gradient Method with Applications in Reinforcement Learning
di: Zeng, Sihan, et al.
Pubblicazione: (2024)

Policy Gradient with Second Order Momentum
di: Sun, Tianyu
Pubblicazione: (2025)

Model-free Reinforcement Learning of Semantic Communication by Stochastic Policy Gradient
di: Beck, Edgar, et al.
Pubblicazione: (2023)

Stochastic Normalized Gradient Descent with Momentum for Large-Batch Training
di: Zhao, Shen-Yi, et al.
Pubblicazione: (2020)

On-Policy Policy Gradient Reinforcement Learning Without On-Policy Sampling
di: Corrado, Nicholas E., et al.
Pubblicazione: (2023)

Dynamic Momentum Recalibration in Online Gradient Learning
di: Yao, Zhipeng, et al.
Pubblicazione: (2026)

Increasing Batch Size Improves Convergence of Stochastic Gradient Descent with Momentum
di: Kamo, Keisuke, et al.
Pubblicazione: (2025)

Compressed Decentralized Momentum Stochastic Gradient Methods for Nonconvex Optimization
di: Liu, Wei, et al.
Pubblicazione: (2025)

Explainable Learning Rate Regimes for Stochastic Optimization
di: Yang, Zhuang
Pubblicazione: (2025)

Rapid Learning in Constrained Minimax Games with Negative Momentum
di: Fang, Zijian, et al.
Pubblicazione: (2024)

Momentum Contrastive Learning with Enhanced Negative Sampling and Hard Negative Filtering
di: Hoang, Duy, et al.
Pubblicazione: (2025)

First and Second Order Approximations to Stochastic Gradient Descent Methods with Momentum Terms
di: Lu, Eric
Pubblicazione: (2025)

Measuring Learning Progress via Gradient-Momentum Coupling
di: Blad, Samuel, et al.
Pubblicazione: (2026)

Beyond Exact Gradients: Convergence of Stochastic Soft-Max Policy Gradient Methods with Entropy Regularization
di: Ding, Yuhao, et al.
Pubblicazione: (2021)

Policy Gradients for Cumulative Prospect Theory in Reinforcement Learning
di: Lepel, Olivier, et al.
Pubblicazione: (2024)

Policy Gradient Methods for Non-Markovian Reinforcement Learning
di: Kar, Avik, et al.
Pubblicazione: (2026)

Algorithmic Stability of Stochastic Gradient Descent with Momentum under Heavy-Tailed Noise
di: Dang, Thanh, et al.
Pubblicazione: (2025)

Deterministic Policy Gradient for Reinforcement Learning with Continuous Time and State
di: Cheng, Ziheng, et al.
Pubblicazione: (2025)

Global Convergence of Natural Policy Gradient with Hessian-aided Momentum Variance Reduction
di: Feng, Jie, et al.
Pubblicazione: (2024)

Cheap Bootstrap for Fast Uncertainty Quantification of Stochastic Gradient Descent
di: Lam, Henry, et al.
Pubblicazione: (2023)

Reusing Trajectories in Policy Gradients Enables Fast Convergence
di: Montenegro, Alessandro, et al.
Pubblicazione: (2025)

LPPG-RL: Lexicographically Projected Policy Gradient Reinforcement Learning with Subproblem Exploration
di: Qiu, Ruiyu, et al.
Pubblicazione: (2025)

Last-Iterate Global Convergence of Policy Gradients for Constrained Reinforcement Learning
di: Montenegro, Alessandro, et al.
Pubblicazione: (2024)

Global Convergence of Wasserstein Policy Gradient for Entropy-Regularized Reinforcement Learning
di: Zhu, Zhaoyu, et al.
Pubblicazione: (2026)

A Bias-Correction Decentralized Stochastic Gradient Algorithm with Momentum Acceleration
di: Hu, Yuchen, et al.
Pubblicazione: (2025)

Zeroth-Order Policy Gradient for Reinforcement Learning from Human Feedback without Reward Inference
di: Zhang, Qining, et al.
Pubblicazione: (2024)

Emergence of Exploration in Policy Gradient Reinforcement Learning via Retrying
di: Nishimori, Soichiro, et al.
Pubblicazione: (2026)

$K$-Level Policy Gradients for Multi-Agent Reinforcement Learning
di: Reddi, Aryaman, et al.
Pubblicazione: (2025)

Proximal Policy Gradient Arborescence for Quality Diversity Reinforcement Learning
di: Batra, Sumeet, et al.
Pubblicazione: (2023)

On the Effect of Negative Gradient in Group Relative Deep Reinforcement Optimization
di: Deng, Wenlong, et al.
Pubblicazione: (2025)

A Lyapunov Analysis of Softmax Policy Gradient for Stochastic Bandits
di: Lattimore, Tor
Pubblicazione: (2026)

PSMGD: Periodic Stochastic Multi-Gradient Descent for Fast Multi-Objective Optimization
di: Xu, Mingjing, et al.
Pubblicazione: (2024)

Performative Policy Gradient: Optimality in Performative Reinforcement Learning
di: Basu, Debabrota, et al.
Pubblicazione: (2025)

Reinforcement Learning Friendly Vision-Language Model for Minecraft
di: Jiang, Haobin, et al.
Pubblicazione: (2023)

Accuracy of Discretely Sampled Stochastic Policies in Continuous-time Reinforcement Learning
di: Jia, Yanwei, et al.
Pubblicazione: (2025)