:: Library Catalog

Cover Image

Saved in:

Bibliographic Details
Main Authors:	Tuyen, Le Pham, Vien, Ngo Anh, Layek, Abu, Chung, TaeChoong
Format:	Preprint
Published:	2018
Subjects:	Artificial Intelligence
Online Access:	https://arxiv.org/abs/1805.04419
Tags:	Add Tag No Tags, Be the first to tag this record!

Similar Items

Recursively-Constrained Partially Observable Markov Decision Processes
by: Ho, Qi Heng, et al.
Published: (2023)

AAC: Admissible-by-Architecture Differentiable Landmark Compression for ALT
by: Le, An T., et al.
Published: (2026)

Pessimism in the Face of Confounders: Provably Efficient Offline Reinforcement Learning in Partially Observable Markov Decision Processes
by: Lu, Miao, et al.
Published: (2022)

Pseudo-Labeling and Contextual Curriculum Learning for Online Grasp Learning in Robotic Bin Picking
by: Le, Huy, et al.
Published: (2024)

Intermittently Observable Markov Decision Processes
by: Chen, Gongpu, et al.
Published: (2023)

Observation Adaptation via Annealed Importance Resampling for Partially Observable Markov Decision Processes
by: Zhang, Yunuo, et al.
Published: (2025)

Inferring Reward Machines and Transition Machines from Partially Observable Markov Decision Processes
by: Wu, Yuly, et al.
Published: (2025)

Optimal Control of Logically Constrained Partially Observable and Multi-Agent Markov Decision Processes
by: Kalagarla, Krishna C., et al.
Published: (2023)

Globally Optimal Hierarchical Reinforcement Learning for Linearly-Solvable Markov Decision Processes
by: Infante, Guillermo, et al.
Published: (2021)

Dynamic Deep-Reinforcement-Learning Algorithm in Partially Observable Markov Decision Processes
by: Omi, Saki, et al.
Published: (2023)

Recurrent Deep Reinforcement Learning for Chemotherapy Control under Partial Observability
by: Kiram, Firas Mohamed Elamine, et al.
Published: (2026)

Reinforcement Learning in Switching Non-Stationary Markov Decision Processes: Algorithms and Convergence Analysis
by: Amiri, Mohsen, et al.
Published: (2025)

Learning Algorithms for Verification of Markov Decision Processes
by: Brázdil, Tomáš, et al.
Published: (2024)

Mitigating Partial Observability in Sequential Decision Processes via the Lambda Discrepancy
by: Allen, Cameron, et al.
Published: (2024)

Uncertainty-driven Exploration Strategies for Online Grasp Learning
by: Shi, Yitian, et al.
Published: (2023)

Uncertainty Representations in State-Space Layers for Deep Reinforcement Learning under Partial Observability
by: Luis, Carlos E., et al.
Published: (2024)

Zero-Shot Reinforcement Learning Under Partial Observability
by: Jeen, Scott, et al.
Published: (2025)

Equivariant Reinforcement Learning under Partial Observability
by: Nguyen, Hai, et al.
Published: (2024)

Near-Optimal Partially Observable Reinforcement Learning with Partial Online State Information
by: Shi, Ming, et al.
Published: (2023)

Diffusion-Augmented Markov Decision Processes for Maximum Entropy Reinforcement Learning
by: Sanokowski, Sebastian, et al.
Published: (2025)

Hierarchical Average-Reward Linearly-solvable Markov Decision Processes
by: Infante, Guillermo, et al.
Published: (2024)

Provable Representation with Efficient Planning for Partial Observable Reinforcement Learning
by: Zhang, Hongming, et al.
Published: (2023)

Provably Efficient Reward Transfer in Reinforcement Learning with Discrete Markov Decision Processes
by: Vora, Kevin, et al.
Published: (2025)

Robust Deep Reinforcement Learning for Inverter-based Volt-Var Control in Partially Observable Distribution Networks
by: Liu, Qiong, et al.
Published: (2024)

Multi-Step First: A Lightweight Deep Reinforcement Learning Strategy for Robust Continuous Control with Partial Observability
by: Meng, Lingheng, et al.
Published: (2022)

Why Linear Recurrent Memory Works in Partially Observable Reinforcement Learning
by: Zhao, Yike, et al.
Published: (2026)

Quantile Markov Decision Process
by: Li, Xiaocheng, et al.
Published: (2017)

Creativity and Markov Decision Processes
by: Lahikainen, Joonas, et al.
Published: (2024)

Policy Gradient Algorithms with Monte Carlo Tree Learning for Non-Markov Decision Processes
by: Morimura, Tetsuro, et al.
Published: (2022)

Semi-Markov Reinforcement Learning for City-Scale EV Ride-Hailing with Feasibility-Guaranteed Actions
by: Nguyen, An, et al.
Published: (2026)

Partially Observable Mean Field Multi-Agent Reinforcement Learning Based on Graph-Attention
by: Yang, Min, et al.
Published: (2023)

Information Seeking for Robust Decision Making under Partial Observability
by: Fang, Djengo Cyun-Jyun, et al.
Published: (2025)

Benchmarking Partial Observability in Reinforcement Learning with a Suite of Memory-Improvable Domains
by: Tao, Ruo Yu, et al.
Published: (2025)

Belief States for Cooperative Multi-Agent Reinforcement Learning under Partial Observability
by: Pritz, Paul J., et al.
Published: (2025)

On the Role of Information Structure in Reinforcement Learning for Partially-Observable Sequential Teams and Games
by: Altabaa, Awni, et al.
Published: (2024)

A Convolution and Attention Based Encoder for Reinforcement Learning under Partial Observability
by: Wang, Wuhao, et al.
Published: (2025)

Learning Interpretable Policies in Hindsight-Observable POMDPs through Partially Supervised Reinforcement Learning
by: Lanier, Michael, et al.
Published: (2024)

Counterfactual Influence in Markov Decision Processes
by: Kazemi, Milad, et al.
Published: (2024)

PIANIST: Learning Partially Observable World Models with LLMs for Multi-Agent Decision Making
by: Light, Jonathan, et al.
Published: (2024)

Learning to Focus: Prioritizing Informative Histories with Structured Attention Mechanisms in Partially Observable Reinforcement Learning
by: Allegue, Daniel De Dios, et al.
Published: (2025)