:: Library Catalog

Buchumschlag

Gespeichert in:

Bibliographische Detailangaben
1. Verfasser:	Farhi, Nadir
Format:	Preprint
Veröffentlicht:	2025
Schlagworte:	Machine Learning Artificial Intelligence Optimization and Control
Online-Zugang:	https://arxiv.org/abs/2510.18074
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Ähnliche Einträge

Performative Policy Gradient: Optimality in Performative Reinforcement Learning
von: Basu, Debabrota, et al.
Veröffentlicht: (2025)

Deterministic Policy Gradient for Reinforcement Learning with Continuous Time and State
von: Cheng, Ziheng, et al.
Veröffentlicht: (2025)

CORL: Reinforcement Learning of MILP Policies Solved via Branch and Bound
von: Anand, Akhil S, et al.
Veröffentlicht: (2025)

Policy Gradient Methods for Risk-Sensitive Distributional Reinforcement Learning with Provable Convergence
von: Xiao, Minheng, et al.
Veröffentlicht: (2024)

Benchmarking Reinforcement Learning via Stochastic Converse Optimality: Generating Systems with Known Optimal Policies
von: Ibrahim, Sinan, et al.
Veröffentlicht: (2026)

Classical and Deep Reinforcement Learning Inventory Control Policies for Pharmaceutical Supply Chains with Perishability and Non-Stationarity
von: Stranieri, Francesco, et al.
Veröffentlicht: (2025)

Examining Policy Entropy of Reinforcement Learning Agents for Personalization Tasks
von: Dereventsov, Anton, et al.
Veröffentlicht: (2022)

Agentic Transformers Provably Learn to Search via Reinforcement Learning
von: Yang, Tong, et al.
Veröffentlicht: (2026)

Contextual Bilevel Reinforcement Learning for Incentive Alignment
von: Thoma, Vinzenz, et al.
Veröffentlicht: (2024)

Deep Reinforcement Learning for Traveling Purchaser Problems
von: Yuan, Haofeng, et al.
Veröffentlicht: (2024)

Faster Reinforcement Learning by Freezing Slow States
von: Wang, Yijia, et al.
Veröffentlicht: (2023)

Adaptive Primal-Dual Method for Safe Reinforcement Learning
von: Chen, Weiqin, et al.
Veröffentlicht: (2024)

Reinforcement Learning for Multi-Truck Vehicle Routing Problems
von: Levin, Joshua, et al.
Veröffentlicht: (2022)

Hyperparameter Optimization for Driving Strategies Based on Reinforcement Learning
von: Adde, Nihal Acharya, et al.
Veröffentlicht: (2024)

Temporal Difference Learning with Compressed Updates: Error-Feedback meets Reinforcement Learning
von: Mitra, Aritra, et al.
Veröffentlicht: (2023)

DualSchool: How Reliable are LLMs for Optimization Education?
von: Klamkin, Michael, et al.
Veröffentlicht: (2025)

Accelerating Cutting-Plane Algorithms via Reinforcement Learning Surrogates
von: Mana, Kyle, et al.
Veröffentlicht: (2023)

Combining Reinforcement Learning and Optimal Transport for the Traveling Salesman Problem
von: Goh, Yong Liang, et al.
Veröffentlicht: (2022)

Action Dependency Graphs for Globally Optimal Coordinated Reinforcement Learning
von: Ding, Jianglin, et al.
Veröffentlicht: (2025)

Global Convergence Guarantees for Federated Policy Gradient Methods with Adversaries
von: Ganesh, Swetha, et al.
Veröffentlicht: (2024)

Reinforcement Learning under Latent Dynamics: Toward Statistical and Algorithmic Modularity
von: Amortila, Philip, et al.
Veröffentlicht: (2024)

Koopman-Assisted Reinforcement Learning
von: Rozwood, Preston, et al.
Veröffentlicht: (2024)

ART for Diffusion Sampling: A Reinforcement Learning Approach to Timestep Schedule
von: Huang, Yilie, et al.
Veröffentlicht: (2026)

Deep Reinforcement Learning for Solving the Fleet Size and Mix Vehicle Routing Problem
von: Wan, Pengfu, et al.
Veröffentlicht: (2025)

Robust Reinforcement Learning in Finance: Modeling Market Impact with Elliptic Uncertainty Sets
von: Ma, Shaocong, et al.
Veröffentlicht: (2025)

Provable Offline Reinforcement Learning for Structured Cyclic MDPs
von: Lee, Kyungbok, et al.
Veröffentlicht: (2026)

Statistical and Algorithmic Foundations of Reinforcement Learning
von: Chi, Yuejie, et al.
Veröffentlicht: (2025)

Closing the Loop: Coordinating Inventory and Recommendation via Deep Reinforcement Learning on Multiple Timescales
von: Jiang, Jinyang, et al.
Veröffentlicht: (2025)

DR-SAC: Distributionally Robust Soft Actor-Critic for Reinforcement Learning under Uncertainty
von: Cui, Mingxuan, et al.
Veröffentlicht: (2025)

Score as Action: Fine-Tuning Diffusion Generative Models by Continuous-time Reinforcement Learning
von: Zhao, Hanyang, et al.
Veröffentlicht: (2025)

Robust Evolutionary Multi-Objective Network Architecture Search for Reinforcement Learning (EMNAS-RL)
von: Adde, Nihal Acharya, et al.
Veröffentlicht: (2025)

Solving Truly Massive Budgeted Monotonic POMDPs with Oracle-Guided Meta-Reinforcement Learning
von: Vora, Manav, et al.
Veröffentlicht: (2024)

A Retention-Centric Framework for Continual Learning with Guaranteed Model Developmental Safety
von: Li, Gang, et al.
Veröffentlicht: (2024)

Lyapunov Function Consistent Adaptive Network Signal Control with Back Pressure and Reinforcement Learning
von: Ma, Chaolun, et al.
Veröffentlicht: (2022)

Sublinear Regret for a Class of Continuous-Time Linear-Quadratic Reinforcement Learning Problems
von: Huang, Yilie, et al.
Veröffentlicht: (2024)

Infinite-Horizon Reach-Avoid Zero-Sum Games via Deep Reinforcement Learning
von: Li, Jingqi, et al.
Veröffentlicht: (2022)

AI2STOW: End-to-End Deep Reinforcement Learning to Construct Master Stowage Plans under Demand Uncertainty
von: Van Twiller, Jaike, et al.
Veröffentlicht: (2025)

Multi-CALF: A Policy Combination Approach with Statistical Guarantees
von: Malaniya, Georgiy, et al.
Veröffentlicht: (2025)

Learning Branching Policies for MILPs with Proximal Policy Optimization
von: Mhamed, Abdelouahed Ben, et al.
Veröffentlicht: (2025)

Hierarchical Deep Reinforcement Learning Framework for Multi-Year Asset Management Under Budget Constraints
von: Fard, Amir, et al.
Veröffentlicht: (2025)