:: Library Catalog

Image de couverture de livre

Enregistré dans:

Détails bibliographiques
Auteurs principaux:	Rojas, Juan Sebastian, Lee, Chi-Guhn
Format:	Preprint
Publié:	2025
Sujets:	Machine Learning Artificial Intelligence
Accès en ligne:	https://arxiv.org/abs/2506.03333
Tags:	Ajouter un tag Pas de tags, Soyez le premier à ajouter un tag!

Documents similaires

Deep Reinforcement Learning and The Tale of Two Temporal Difference Errors
par: Rojas, Juan Sebastian, et autres
Publié: (2026)

Ergodic Risk Measures: Towards a Risk-Aware Foundation for Continual Reinforcement Learning
par: Rojas, Juan Sebastian, et autres
Publié: (2025)

Burning RED: Unlocking Subtask-Driven Reinforcement Learning and Risk-Awareness in Average-Reward Markov Decision Processes
par: Rojas, Juan Sebastian, et autres
Publié: (2024)

Learning Bilateral Team Formation in Cooperative Multi-Agent Reinforcement Learning
par: Moslemi, Koorosh, et autres
Publié: (2025)

Thermodynamics of Reinforcement Learning Curricula
par: Adamczyk, Jacob, et autres
Publié: (2026)

Differential Information Distribution: A Bayesian Perspective on Direct Preference Optimization
par: Won, Yunjae, et autres
Publié: (2025)

Rethinking Adversarial Attacks in Reinforcement Learning from Policy Distribution Perspective
par: Duan, Tianyang, et autres
Publié: (2025)

PG-Rainbow: Using Distributional Reinforcement Learning in Policy Gradient Methods
par: Jeon, WooJae, et autres
Publié: (2024)

Is Inverse Reinforcement Learning Harder than Standard Reinforcement Learning? A Theoretical Perspective
par: Zhao, Lei, et autres
Publié: (2023)

Optimizing Automatic Differentiation with Deep Reinforcement Learning
par: Lohoff, Jamie, et autres
Publié: (2024)

MADQRL: Distributed Quantum Reinforcement Learning Framework for Multi-Agent Environments
par: Sawaika, Abhishek, et autres
Publié: (2026)

Bellman Unbiasedness: Toward Provably Efficient Distributional Reinforcement Learning with General Value Function Approximation
par: Cho, Taehyun, et autres
Publié: (2024)

An Optimal Discriminator Weighted Imitation Perspective for Reinforcement Learning
par: Xu, Haoran, et autres
Publié: (2025)

Graph Reinforcement Learning for Combinatorial Optimization: A Survey and Unifying Perspective
par: Darvariu, Victor-Alexandru, et autres
Publié: (2024)

Revisiting Generative Policies: A Simpler Reinforcement Learning Algorithmic Perspective
par: Zhang, Jinouwen, et autres
Publié: (2024)

Towards Differentially Private Reinforcement Learning with General Function Approximation
par: He, Yi, et autres
Publié: (2026)

Quantile Geometry Regularization for Distributional Reinforcement Learning
par: Zhang, Zhaofan, et autres
Publié: (2026)

Conservative Distributional Reinforcement Learning with Safety Constraints
par: Zhang, Hengrui, et autres
Publié: (2022)

Value-Distributional Model-Based Reinforcement Learning
par: Luis, Carlos E., et autres
Publié: (2023)

Single-Trajectory Distributionally Robust Reinforcement Learning
par: Liang, Zhipeng, et autres
Publié: (2023)

Diverse Projection Ensembles for Distributional Reinforcement Learning
par: Zanger, Moritz A., et autres
Publié: (2023)

On Distributional Reinforcement Learning in Chaotic Dynamical Systems
par: Rudd-Jones, James, et autres
Publié: (2026)

ARCLE: The Abstraction and Reasoning Corpus Learning Environment for Reinforcement Learning
par: Lee, Hosung, et autres
Publié: (2024)

CALF: Communication-Aware Learning Framework for Distributed Reinforcement Learning
par: Purves, Carlos, et autres
Publié: (2026)

Scaling of Search and Learning: A Roadmap to Reproduce o1 from Reinforcement Learning Perspective
par: Zeng, Zhiyuan, et autres
Publié: (2024)

Preserve Support, Not Correspondence: Dynamic Routing for Offline Reinforcement Learning
par: Mu, Zhancun, et autres
Publié: (2026)

Diffusion-Augmented Markov Decision Processes for Maximum Entropy Reinforcement Learning
par: Sanokowski, Sebastian, et autres
Publié: (2025)

Normality-Guided Distributional Reinforcement Learning for Continuous Control
par: Byun, Ju-Seung, et autres
Publié: (2022)

Revisiting Reinforcement Learning with Verifiable Rewards from a Contrastive Perspective
par: Zhang, Feng, et autres
Publié: (2026)

Balance Reward and Safety Optimization for Safe Reinforcement Learning: A Perspective of Gradient Manipulation
par: Gu, Shangding, et autres
Publié: (2024)

Rethinking Reinforcement fine-tuning of LLMs: A Multi-armed Bandit Learning Perspective
par: Hu, Xiao, et autres
Publié: (2026)

A Survey on Data-Centric AI: Tabular Learning from Reinforcement Learning and Generative AI Perspective
par: Ying, Wangyang, et autres
Publié: (2025)

Plasticity Loss in Deep Reinforcement Learning: A Survey
par: Klein, Timo, et autres
Publié: (2024)

A New Perspective on Transformers in Online Reinforcement Learning for Continuous Control
par: Kachaev, Nikita, et autres
Publié: (2025)

Thinking with Deltas: Incentivizing Reinforcement Learning via Differential Visual Reasoning Policy
par: Gao, Shujian, et autres
Publié: (2026)

A Recipe for Stable Offline Multi-agent Reinforcement Learning
par: Lee, Dongsu, et autres
Publié: (2026)

Flow-based Policy With Distributional Reinforcement Learning in Trajectory Optimization
par: Hao, Ruijie, et autres
Publié: (2026)

Differentiable Quantum Architecture Search in Asynchronous Quantum Reinforcement Learning
par: Chen, Samuel Yen-Chi
Publié: (2024)

Continuous Control Reinforcement Learning: Distributed Distributional DrQ Algorithms
par: Zhou, Zehao
Publié: (2024)

FairDICE: Fairness-Driven Offline Multi-Objective Reinforcement Learning
par: Kim, Woosung, et autres
Publié: (2025)