:: Library Catalog

Buchumschlag

Gespeichert in:

Bibliographische Detailangaben
Hauptverfasser:	Cassel, Asaf, Rosenberg, Aviv
Format:	Preprint
Veröffentlicht:	2024
Schlagworte:	Machine Learning
Online-Zugang:	https://arxiv.org/abs/2407.03065
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Ähnliche Einträge

Near-Optimal Regret in Linear MDPs with Aggregate Bandit Feedback
von: Cassel, Asaf, et al.
Veröffentlicht: (2024)

Horizon-Free Regret for Linear Markov Decision Processes
von: Zhang, Zihan, et al.
Veröffentlicht: (2024)

Batch Ensemble for Variance Dependent Regret in Stochastic Bandits
von: Cassel, Asaf, et al.
Veröffentlicht: (2024)

Near-Optimal Regret for Policy Optimization in Contextual MDPs with General Offline Function Approximation
von: Levy, Orin, et al.
Veröffentlicht: (2026)

Eluder-based Regret for Stochastic Contextual MDPs
von: Levy, Orin, et al.
Veröffentlicht: (2022)

Achieving Constant Regret in Linear Markov Decision Processes
von: Zhang, Weitong, et al.
Veröffentlicht: (2024)

Rate-Optimal Policy Optimization for Linear Markov Decision Processes
von: Sherman, Uri, et al.
Veröffentlicht: (2023)

PromptEvolver: Prompt Inversion through Evolutionary Optimization in Natural-Language Space
von: Buchnick, Asaf, et al.
Veröffentlicht: (2026)

Logarithmic Regret of Exploration in Average Reward Markov Decision Processes
von: Boone, Victor, et al.
Veröffentlicht: (2025)

Regret Analysis of Policy Gradient Algorithm for Infinite Horizon Average Reward Markov Decision Processes
von: Bai, Qinbo, et al.
Veröffentlicht: (2023)

No-Regret Thompson Sampling for Finite-Horizon Markov Decision Processes with Gaussian Processes
von: Bayrooti, Jasmine, et al.
Veröffentlicht: (2025)

Optimistic Actor-Critic with Parametric Policies for Linear Markov Decision Processes
von: Lin, Max Qiushi, et al.
Veröffentlicht: (2026)

Generalized Linear Markov Decision Process
von: Zhang, Sinian, et al.
Veröffentlicht: (2025)

Optimistic Regret Bounds for Online Learning in Adversarial Markov Decision Processes
von: Moon, Sang Bin, et al.
Veröffentlicht: (2024)

SPOT: Scalable Policy Optimization with Trees for Markov Decision Processes
von: Xiong, Xuyuan, et al.
Veröffentlicht: (2025)

Policy Testing in Markov Decision Processes
von: Ariu, Kaito, et al.
Veröffentlicht: (2025)

Policy Regularized Distributionally Robust Markov Decision Processes with Linear Function Approximation
von: Gu, Jingwen, et al.
Veröffentlicht: (2025)

Test-Time Regret Minimization in Meta Reinforcement Learning
von: Mutti, Mirco, et al.
Veröffentlicht: (2024)

Optimal Decision Tree Policies for Markov Decision Processes
von: Vos, Daniël, et al.
Veröffentlicht: (2023)

Multi-turn Reinforcement Learning from Preference Human Feedback
von: Shani, Lior, et al.
Veröffentlicht: (2024)

Policy Gradient for Robust Markov Decision Processes
von: Wang, Qiuhao, et al.
Veröffentlicht: (2024)

Learning Deterministic Policies with Policy Gradients in Constrained Markov Decision Processes
von: Montenegro, Alessandro, et al.
Veröffentlicht: (2025)

Multi-Timescale Ensemble Q-learning for Markov Decision Process Policy Optimization
von: Bozkus, Talha, et al.
Veröffentlicht: (2024)

Improving Controller Generalization with Dimensionless Markov Decision Processes
von: Charvet, Valentin, et al.
Veröffentlicht: (2025)

Quantum Speedups in Regret Analysis of Infinite Horizon Average-Reward Markov Decision Processes
von: Ganguly, Bhargav, et al.
Veröffentlicht: (2023)

Improved Regret of Linear Ensemble Sampling
von: Lee, Harin, et al.
Veröffentlicht: (2024)

Minimax-Optimal Policy Regret in Partially Observable Markov Games
von: Arora, Raman
Veröffentlicht: (2026)

Linear Mixture Distributionally Robust Markov Decision Processes
von: Liu, Zhishuai, et al.
Veröffentlicht: (2025)

Approximate Linear Programming for Decentralized Policy Iteration in Cooperative Multi-agent Markov Decision Processes
von: Mandal, Lakshmi, et al.
Veröffentlicht: (2023)

Performative Reinforcement Learning with Linear Markov Decision Process
von: Mandal, Debmalya, et al.
Veröffentlicht: (2024)

Hierarchical Average-Reward Linearly-solvable Markov Decision Processes
von: Infante, Guillermo, et al.
Veröffentlicht: (2024)

Optimal Posterior Sampling for Policy Identification in Tabular Markov Decision Processes
von: Kone, Cyrille, et al.
Veröffentlicht: (2026)

Conformal Off-Policy Evaluation in Markov Decision Processes
von: Foffano, Daniele, et al.
Veröffentlicht: (2023)

Flipping-based Policy for Chance-Constrained Markov Decision Processes
von: Shen, Xun, et al.
Veröffentlicht: (2024)

Transition Constrained Bayesian Optimization via Markov Decision Processes
von: Folch, Jose Pablo, et al.
Veröffentlicht: (2024)

Online Weighted Paging with Unknown Weights
von: Levy, Orin, et al.
Veröffentlicht: (2024)

Monitored Markov Decision Processes
von: Parisi, Simone, et al.
Veröffentlicht: (2024)

Parameter-Free Dynamic Regret for Unconstrained Linear Bandits
von: Rumi, Alberto, et al.
Veröffentlicht: (2026)

Sample Complexity of Offline Distributionally Robust Linear Markov Decision Processes
von: Wang, He, et al.
Veröffentlicht: (2024)

Off-Policy Evaluation in Markov Decision Processes under Weak Distributional Overlap
von: Mehrabi, Mohammad, et al.
Veröffentlicht: (2024)