Gespeichert in:
| 1. Verfasser: | Farhi, Nadir |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2025
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2510.18074 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
Performative Policy Gradient: Optimality in Performative Reinforcement Learning
von: Basu, Debabrota, et al.
Veröffentlicht: (2025)
von: Basu, Debabrota, et al.
Veröffentlicht: (2025)
Deterministic Policy Gradient for Reinforcement Learning with Continuous Time and State
von: Cheng, Ziheng, et al.
Veröffentlicht: (2025)
von: Cheng, Ziheng, et al.
Veröffentlicht: (2025)
CORL: Reinforcement Learning of MILP Policies Solved via Branch and Bound
von: Anand, Akhil S, et al.
Veröffentlicht: (2025)
von: Anand, Akhil S, et al.
Veröffentlicht: (2025)
Policy Gradient Methods for Risk-Sensitive Distributional Reinforcement Learning with Provable Convergence
von: Xiao, Minheng, et al.
Veröffentlicht: (2024)
von: Xiao, Minheng, et al.
Veröffentlicht: (2024)
Benchmarking Reinforcement Learning via Stochastic Converse Optimality: Generating Systems with Known Optimal Policies
von: Ibrahim, Sinan, et al.
Veröffentlicht: (2026)
von: Ibrahim, Sinan, et al.
Veröffentlicht: (2026)
Classical and Deep Reinforcement Learning Inventory Control Policies for Pharmaceutical Supply Chains with Perishability and Non-Stationarity
von: Stranieri, Francesco, et al.
Veröffentlicht: (2025)
von: Stranieri, Francesco, et al.
Veröffentlicht: (2025)
Examining Policy Entropy of Reinforcement Learning Agents for Personalization Tasks
von: Dereventsov, Anton, et al.
Veröffentlicht: (2022)
von: Dereventsov, Anton, et al.
Veröffentlicht: (2022)
Agentic Transformers Provably Learn to Search via Reinforcement Learning
von: Yang, Tong, et al.
Veröffentlicht: (2026)
von: Yang, Tong, et al.
Veröffentlicht: (2026)
Contextual Bilevel Reinforcement Learning for Incentive Alignment
von: Thoma, Vinzenz, et al.
Veröffentlicht: (2024)
von: Thoma, Vinzenz, et al.
Veröffentlicht: (2024)
Deep Reinforcement Learning for Traveling Purchaser Problems
von: Yuan, Haofeng, et al.
Veröffentlicht: (2024)
von: Yuan, Haofeng, et al.
Veröffentlicht: (2024)
Faster Reinforcement Learning by Freezing Slow States
von: Wang, Yijia, et al.
Veröffentlicht: (2023)
von: Wang, Yijia, et al.
Veröffentlicht: (2023)
Adaptive Primal-Dual Method for Safe Reinforcement Learning
von: Chen, Weiqin, et al.
Veröffentlicht: (2024)
von: Chen, Weiqin, et al.
Veröffentlicht: (2024)
Reinforcement Learning for Multi-Truck Vehicle Routing Problems
von: Levin, Joshua, et al.
Veröffentlicht: (2022)
von: Levin, Joshua, et al.
Veröffentlicht: (2022)
Hyperparameter Optimization for Driving Strategies Based on Reinforcement Learning
von: Adde, Nihal Acharya, et al.
Veröffentlicht: (2024)
von: Adde, Nihal Acharya, et al.
Veröffentlicht: (2024)
Temporal Difference Learning with Compressed Updates: Error-Feedback meets Reinforcement Learning
von: Mitra, Aritra, et al.
Veröffentlicht: (2023)
von: Mitra, Aritra, et al.
Veröffentlicht: (2023)
DualSchool: How Reliable are LLMs for Optimization Education?
von: Klamkin, Michael, et al.
Veröffentlicht: (2025)
von: Klamkin, Michael, et al.
Veröffentlicht: (2025)
Accelerating Cutting-Plane Algorithms via Reinforcement Learning Surrogates
von: Mana, Kyle, et al.
Veröffentlicht: (2023)
von: Mana, Kyle, et al.
Veröffentlicht: (2023)
Combining Reinforcement Learning and Optimal Transport for the Traveling Salesman Problem
von: Goh, Yong Liang, et al.
Veröffentlicht: (2022)
von: Goh, Yong Liang, et al.
Veröffentlicht: (2022)
Action Dependency Graphs for Globally Optimal Coordinated Reinforcement Learning
von: Ding, Jianglin, et al.
Veröffentlicht: (2025)
von: Ding, Jianglin, et al.
Veröffentlicht: (2025)
Global Convergence Guarantees for Federated Policy Gradient Methods with Adversaries
von: Ganesh, Swetha, et al.
Veröffentlicht: (2024)
von: Ganesh, Swetha, et al.
Veröffentlicht: (2024)
Reinforcement Learning under Latent Dynamics: Toward Statistical and Algorithmic Modularity
von: Amortila, Philip, et al.
Veröffentlicht: (2024)
von: Amortila, Philip, et al.
Veröffentlicht: (2024)
Koopman-Assisted Reinforcement Learning
von: Rozwood, Preston, et al.
Veröffentlicht: (2024)
von: Rozwood, Preston, et al.
Veröffentlicht: (2024)
ART for Diffusion Sampling: A Reinforcement Learning Approach to Timestep Schedule
von: Huang, Yilie, et al.
Veröffentlicht: (2026)
von: Huang, Yilie, et al.
Veröffentlicht: (2026)
Deep Reinforcement Learning for Solving the Fleet Size and Mix Vehicle Routing Problem
von: Wan, Pengfu, et al.
Veröffentlicht: (2025)
von: Wan, Pengfu, et al.
Veröffentlicht: (2025)
Robust Reinforcement Learning in Finance: Modeling Market Impact with Elliptic Uncertainty Sets
von: Ma, Shaocong, et al.
Veröffentlicht: (2025)
von: Ma, Shaocong, et al.
Veröffentlicht: (2025)
Provable Offline Reinforcement Learning for Structured Cyclic MDPs
von: Lee, Kyungbok, et al.
Veröffentlicht: (2026)
von: Lee, Kyungbok, et al.
Veröffentlicht: (2026)
Statistical and Algorithmic Foundations of Reinforcement Learning
von: Chi, Yuejie, et al.
Veröffentlicht: (2025)
von: Chi, Yuejie, et al.
Veröffentlicht: (2025)
Closing the Loop: Coordinating Inventory and Recommendation via Deep Reinforcement Learning on Multiple Timescales
von: Jiang, Jinyang, et al.
Veröffentlicht: (2025)
von: Jiang, Jinyang, et al.
Veröffentlicht: (2025)
DR-SAC: Distributionally Robust Soft Actor-Critic for Reinforcement Learning under Uncertainty
von: Cui, Mingxuan, et al.
Veröffentlicht: (2025)
von: Cui, Mingxuan, et al.
Veröffentlicht: (2025)
Score as Action: Fine-Tuning Diffusion Generative Models by Continuous-time Reinforcement Learning
von: Zhao, Hanyang, et al.
Veröffentlicht: (2025)
von: Zhao, Hanyang, et al.
Veröffentlicht: (2025)
Robust Evolutionary Multi-Objective Network Architecture Search for Reinforcement Learning (EMNAS-RL)
von: Adde, Nihal Acharya, et al.
Veröffentlicht: (2025)
von: Adde, Nihal Acharya, et al.
Veröffentlicht: (2025)
Solving Truly Massive Budgeted Monotonic POMDPs with Oracle-Guided Meta-Reinforcement Learning
von: Vora, Manav, et al.
Veröffentlicht: (2024)
von: Vora, Manav, et al.
Veröffentlicht: (2024)
A Retention-Centric Framework for Continual Learning with Guaranteed Model Developmental Safety
von: Li, Gang, et al.
Veröffentlicht: (2024)
von: Li, Gang, et al.
Veröffentlicht: (2024)
Lyapunov Function Consistent Adaptive Network Signal Control with Back Pressure and Reinforcement Learning
von: Ma, Chaolun, et al.
Veröffentlicht: (2022)
von: Ma, Chaolun, et al.
Veröffentlicht: (2022)
Sublinear Regret for a Class of Continuous-Time Linear-Quadratic Reinforcement Learning Problems
von: Huang, Yilie, et al.
Veröffentlicht: (2024)
von: Huang, Yilie, et al.
Veröffentlicht: (2024)
Infinite-Horizon Reach-Avoid Zero-Sum Games via Deep Reinforcement Learning
von: Li, Jingqi, et al.
Veröffentlicht: (2022)
von: Li, Jingqi, et al.
Veröffentlicht: (2022)
AI2STOW: End-to-End Deep Reinforcement Learning to Construct Master Stowage Plans under Demand Uncertainty
von: Van Twiller, Jaike, et al.
Veröffentlicht: (2025)
von: Van Twiller, Jaike, et al.
Veröffentlicht: (2025)
Multi-CALF: A Policy Combination Approach with Statistical Guarantees
von: Malaniya, Georgiy, et al.
Veröffentlicht: (2025)
von: Malaniya, Georgiy, et al.
Veröffentlicht: (2025)
Learning Branching Policies for MILPs with Proximal Policy Optimization
von: Mhamed, Abdelouahed Ben, et al.
Veröffentlicht: (2025)
von: Mhamed, Abdelouahed Ben, et al.
Veröffentlicht: (2025)
Hierarchical Deep Reinforcement Learning Framework for Multi-Year Asset Management Under Budget Constraints
von: Fard, Amir, et al.
Veröffentlicht: (2025)
von: Fard, Amir, et al.
Veröffentlicht: (2025)
Ähnliche Einträge
-
Performative Policy Gradient: Optimality in Performative Reinforcement Learning
von: Basu, Debabrota, et al.
Veröffentlicht: (2025) -
Deterministic Policy Gradient for Reinforcement Learning with Continuous Time and State
von: Cheng, Ziheng, et al.
Veröffentlicht: (2025) -
CORL: Reinforcement Learning of MILP Policies Solved via Branch and Bound
von: Anand, Akhil S, et al.
Veröffentlicht: (2025) -
Policy Gradient Methods for Risk-Sensitive Distributional Reinforcement Learning with Provable Convergence
von: Xiao, Minheng, et al.
Veröffentlicht: (2024) -
Benchmarking Reinforcement Learning via Stochastic Converse Optimality: Generating Systems with Known Optimal Policies
von: Ibrahim, Sinan, et al.
Veröffentlicht: (2026)