Salvato in:
| Autori principali: | Li, Xiaocheng, Zhong, Huaiyang, Brandeau, Margaret L. |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2017
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/1711.05788 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
Optimistic Reinforcement Learning with Quantile Objectives
di: Alipour-Vaezi, Mohammad, et al.
Pubblicazione: (2025)
di: Alipour-Vaezi, Mohammad, et al.
Pubblicazione: (2025)
Creativity and Markov Decision Processes
di: Lahikainen, Joonas, et al.
Pubblicazione: (2024)
di: Lahikainen, Joonas, et al.
Pubblicazione: (2024)
Sharpe Ratio Optimization in Markov Decision Processes
di: Ma, Shuai, et al.
Pubblicazione: (2025)
di: Ma, Shuai, et al.
Pubblicazione: (2025)
Counterfactual Influence in Markov Decision Processes
di: Kazemi, Milad, et al.
Pubblicazione: (2024)
di: Kazemi, Milad, et al.
Pubblicazione: (2024)
Exploration-free Algorithms for Multi-group Mean Estimation
di: Wei, Ziyi, et al.
Pubblicazione: (2025)
di: Wei, Ziyi, et al.
Pubblicazione: (2025)
What Matters in Data for DPO?
di: Pan, Yu, et al.
Pubblicazione: (2025)
di: Pan, Yu, et al.
Pubblicazione: (2025)
Robust Counterfactual Inference in Markov Decision Processes
di: Lally, Jessica, et al.
Pubblicazione: (2025)
di: Lally, Jessica, et al.
Pubblicazione: (2025)
Optimal Decision Tree Policies for Markov Decision Processes
di: Vos, Daniël, et al.
Pubblicazione: (2023)
di: Vos, Daniël, et al.
Pubblicazione: (2023)
Intermittently Observable Markov Decision Processes
di: Chen, Gongpu, et al.
Pubblicazione: (2023)
di: Chen, Gongpu, et al.
Pubblicazione: (2023)
Value Iteration with Guessing for Markov Chains and Markov Decision Processes
di: Chatterjee, Krishnendu, et al.
Pubblicazione: (2025)
di: Chatterjee, Krishnendu, et al.
Pubblicazione: (2025)
Markov Decision Processes under External Temporal Processes
di: Ayyagari, Ranga Shaarad, et al.
Pubblicazione: (2023)
di: Ayyagari, Ranga Shaarad, et al.
Pubblicazione: (2023)
Counterfactual Strategies for Markov Decision Processes
di: Kobialka, Paul, et al.
Pubblicazione: (2025)
di: Kobialka, Paul, et al.
Pubblicazione: (2025)
Generalization in Monitored Markov Decision Processes (Mon-MDPs)
di: Mohammedalamen, Montaser, et al.
Pubblicazione: (2025)
di: Mohammedalamen, Montaser, et al.
Pubblicazione: (2025)
Causal Temporal Reasoning for Markov Decision Processes
di: Kazemi, Milad, et al.
Pubblicazione: (2022)
di: Kazemi, Milad, et al.
Pubblicazione: (2022)
Policy Gradient for Robust Markov Decision Processes
di: Wang, Qiuhao, et al.
Pubblicazione: (2024)
di: Wang, Qiuhao, et al.
Pubblicazione: (2024)
Recursively-Constrained Partially Observable Markov Decision Processes
di: Ho, Qi Heng, et al.
Pubblicazione: (2023)
di: Ho, Qi Heng, et al.
Pubblicazione: (2023)
Attribution-based Explanations for Markov Decision Processes
di: Kobialka, Paul, et al.
Pubblicazione: (2026)
di: Kobialka, Paul, et al.
Pubblicazione: (2026)
Beyond Average Return in Markov Decision Processes
di: Marthe, Alexandre, et al.
Pubblicazione: (2023)
di: Marthe, Alexandre, et al.
Pubblicazione: (2023)
Interval Markov Decision Processes with Continuous Action-Spaces
di: Delimpaltadakis, Giannis, et al.
Pubblicazione: (2022)
di: Delimpaltadakis, Giannis, et al.
Pubblicazione: (2022)
OCMDP: Observation-Constrained Markov Decision Process
di: Wang, Taiyi, et al.
Pubblicazione: (2024)
di: Wang, Taiyi, et al.
Pubblicazione: (2024)
Homomorphic Mappings for Value-Preserving State Aggregation in Markov Decision Processes
di: Zhao, Shuo, et al.
Pubblicazione: (2025)
di: Zhao, Shuo, et al.
Pubblicazione: (2025)
OMGPT: A Sequence Modeling Framework for Data-driven Operational Decision Making
di: Wang, Hanzhao, et al.
Pubblicazione: (2025)
di: Wang, Hanzhao, et al.
Pubblicazione: (2025)
Structuring Value Representations via Geometric Coherence in Markov Decision Processes
di: Zhang, Zuyuan, et al.
Pubblicazione: (2026)
di: Zhang, Zuyuan, et al.
Pubblicazione: (2026)
Best-Effort Policies for Robust Markov Decision Processes
di: Abate, Alessandro, et al.
Pubblicazione: (2025)
di: Abate, Alessandro, et al.
Pubblicazione: (2025)
Linear Mixture Distributionally Robust Markov Decision Processes
di: Liu, Zhishuai, et al.
Pubblicazione: (2025)
di: Liu, Zhishuai, et al.
Pubblicazione: (2025)
Learning Algorithms for Verification of Markov Decision Processes
di: Brázdil, Tomáš, et al.
Pubblicazione: (2024)
di: Brázdil, Tomáš, et al.
Pubblicazione: (2024)
SPOT: Scalable Policy Optimization with Trees for Markov Decision Processes
di: Xiong, Xuyuan, et al.
Pubblicazione: (2025)
di: Xiong, Xuyuan, et al.
Pubblicazione: (2025)
Solving Robust Markov Decision Processes: Generic, Reliable, Efficient
di: Meggendorfer, Tobias, et al.
Pubblicazione: (2024)
di: Meggendorfer, Tobias, et al.
Pubblicazione: (2024)
Hierarchical Average-Reward Linearly-solvable Markov Decision Processes
di: Infante, Guillermo, et al.
Pubblicazione: (2024)
di: Infante, Guillermo, et al.
Pubblicazione: (2024)
Act as You Learn: Adaptive Decision-Making in Non-Stationary Markov Decision Processes
di: Luo, Baiting, et al.
Pubblicazione: (2024)
di: Luo, Baiting, et al.
Pubblicazione: (2024)
Conformal Off-Policy Evaluation in Markov Decision Processes
di: Foffano, Daniele, et al.
Pubblicazione: (2023)
di: Foffano, Daniele, et al.
Pubblicazione: (2023)
Deep Hierarchical Reinforcement Learning Algorithm in Partially Observable Markov Decision Processes
di: Tuyen, Le Pham, et al.
Pubblicazione: (2018)
di: Tuyen, Le Pham, et al.
Pubblicazione: (2018)
Robust Reward Design for Markov Decision Processes
di: Wu, Shuo, et al.
Pubblicazione: (2024)
di: Wu, Shuo, et al.
Pubblicazione: (2024)
A Translation of Probabilistic Event Calculus into Markov Decision Processes
di: Xu, Lyris, et al.
Pubblicazione: (2025)
di: Xu, Lyris, et al.
Pubblicazione: (2025)
Diffusion-Augmented Markov Decision Processes for Maximum Entropy Reinforcement Learning
di: Sanokowski, Sebastian, et al.
Pubblicazione: (2025)
di: Sanokowski, Sebastian, et al.
Pubblicazione: (2025)
Lower Bound on Howard Policy Iteration for Deterministic Markov Decision Processes
di: Asadi, Ali, et al.
Pubblicazione: (2025)
di: Asadi, Ali, et al.
Pubblicazione: (2025)
A Unified Theory of Compositionality, Modularity, and Interpretability in Markov Decision Processes
di: Ringstrom, Thomas J., et al.
Pubblicazione: (2025)
di: Ringstrom, Thomas J., et al.
Pubblicazione: (2025)
On Dynamic Programming Decompositions of Static Risk Measures in Markov Decision Processes
di: Hau, Jia Lin, et al.
Pubblicazione: (2023)
di: Hau, Jia Lin, et al.
Pubblicazione: (2023)
Efficient and Sharp Off-Policy Evaluation in Robust Markov Decision Processes
di: Bennett, Andrew, et al.
Pubblicazione: (2024)
di: Bennett, Andrew, et al.
Pubblicazione: (2024)
Optimistic Regret Bounds for Online Learning in Adversarial Markov Decision Processes
di: Moon, Sang Bin, et al.
Pubblicazione: (2024)
di: Moon, Sang Bin, et al.
Pubblicazione: (2024)
Documenti analoghi
-
Optimistic Reinforcement Learning with Quantile Objectives
di: Alipour-Vaezi, Mohammad, et al.
Pubblicazione: (2025) -
Creativity and Markov Decision Processes
di: Lahikainen, Joonas, et al.
Pubblicazione: (2024) -
Sharpe Ratio Optimization in Markov Decision Processes
di: Ma, Shuai, et al.
Pubblicazione: (2025) -
Counterfactual Influence in Markov Decision Processes
di: Kazemi, Milad, et al.
Pubblicazione: (2024) -
Exploration-free Algorithms for Multi-group Mean Estimation
di: Wei, Ziyi, et al.
Pubblicazione: (2025)