:: Library Catalog

Image de couverture de livre

Enregistré dans:

Détails bibliographiques
Auteurs principaux:	Wang, Yudan, Zou, Shaofeng, Wang, Yue
Format:	Preprint
Publié:	2024
Sujets:	Machine Learning Artificial Intelligence
Accès en ligne:	https://arxiv.org/abs/2406.17096
Tags:	Ajouter un tag Pas de tags, Soyez le premier à ajouter un tag!

Documents similaires

Non-Asymptotic Analysis for Single-Loop (Natural) Actor-Critic with Compatible Function Approximation
par: Wang, Yudan, et autres
Publié: (2024)

Achieving the Asymptotically Optimal Sample Complexity of Offline Reinforcement Learning: A DRO-Based Approach
par: Wang, Yue, et autres
Publié: (2023)

Sample Complexity of Distributionally Robust Off-Dynamics Reinforcement Learning with Online Interaction
par: He, Yiting, et autres
Publié: (2025)

Sample Complexity Analysis for Constrained Bilevel Reinforcement Learning
par: Saxena, Naman, et autres
Publié: (2026)

RLVR-World: Training World Models with Reinforcement Learning
par: Wu, Jialong, et autres
Publié: (2025)

Theoretical Study of Conflict-Avoidant Multi-Objective Reinforcement Learning
par: Wang, Yudan, et autres
Publié: (2024)

CADENT: Gated Hybrid Distillation for Sample-Efficient Transfer in Reinforcement Learning
par: Alinejad, Mahyar, et autres
Publié: (2026)

Detector-Evasive LLM Paraphrasing via Constrained Policy Optimization
par: Wang, Mingyi, et autres
Publié: (2026)

On The Sample Complexity Bounds In Bilevel Reinforcement Learning
par: Gaur, Mudit, et autres
Publié: (2025)

GILT: An LLM-Free, Tuning-Free Graph Foundational Model for In-Context Learning
par: Ma, Weishuo, et autres
Publié: (2025)

HIPO: Instruction Hierarchy via Constrained Reinforcement Learning
par: Chen, Keru, et autres
Publié: (2026)

Why Adam Can Beat SGD: Second-Moment Normalization Yields Sharper Tails
par: Jin, Ruinan, et autres
Publié: (2026)

Speculative Sampling with Reinforcement Learning
par: Wang, Chenan, et autres
Publié: (2026)

Step-level Denoising-time Diffusion Alignment with Multiple Objectives
par: Zhang, Qi, et autres
Publié: (2026)

Near-Optimal Sample Complexity for Iterated CVaR Reinforcement Learning with a Generative Model
par: Deng, Zilong, et autres
Publié: (2025)

RIME: Robust Preference-based Reinforcement Learning with Noisy Preferences
par: Cheng, Jie, et autres
Publié: (2024)

On the Statistical Complexity for Offline and Low-Adaptive Reinforcement Learning with Structures
par: Yin, Ming, et autres
Publié: (2025)

Projection by Convolution: Optimal Sample Complexity for Reinforcement Learning in Continuous-Space MDPs
par: Maran, Davide, et autres
Publié: (2024)

Sample Complexity Reduction via Policy Difference Estimation in Tabular Reinforcement Learning
par: Narang, Adhyyan, et autres
Publié: (2024)

Sparse-Reg: Improving Sample Complexity in Offline Reinforcement Learning using Sparsity
par: Arnob, Samin Yeasar, et autres
Publié: (2025)

WOMBET: World Model-based Experience Transfer for Robust and Sample-efficient Reinforcement Learning
par: Kim, Mintae, et autres
Publié: (2026)

Dynamic Adversarial Reinforcement Learning for Robust Multimodal Large Language Models
par: Bao, Yicheng, et autres
Publié: (2026)

Interpreting Emergent Planning in Model-Free Reinforcement Learning
par: Bush, Thomas, et autres
Publié: (2025)

Towards General-Purpose Model-Free Reinforcement Learning
par: Fujimoto, Scott, et autres
Publié: (2025)

Sample and Computationally Efficient Continuous-Time Reinforcement Learning with General Function Approximation
par: Zhao, Runze, et autres
Publié: (2025)

Towards Robust Deep Reinforcement Learning against Environmental State Perturbation
par: Wang, Chenxu, et autres
Publié: (2025)

Drama: Mamba-Enabled Model-Based Reinforcement Learning Is Sample and Parameter Efficient
par: Wang, Wenlong, et autres
Publié: (2024)

RLAF: Reinforcement Learning from Automaton Feedback
par: Alinejad, Mahyar, et autres
Publié: (2025)

Task-Distributionally Robust Data-Free Meta-Learning
par: Hu, Zixuan, et autres
Publié: (2023)

Data-Free Continual Learning of Server Models in Model-Heterogeneous Cloud-Device Collaboration
par: Zhang, Xiao, et autres
Publié: (2025)

Diffusion Models for Reinforcement Learning: Foundations, Taxonomy, and Development
par: Xu, Changfu, et autres
Publié: (2025)

Robust Model-Based Reinforcement Learning with an Adversarial Auxiliary Model
par: Herremans, Siemen, et autres
Publié: (2024)

Multi-State TD Target for Model-Free Reinforcement Learning
par: Wang, Wuhao, et autres
Publié: (2024)

UACER: An Uncertainty-Adaptive Critic Ensemble Framework for Robust Adversarial Reinforcement Learning
par: Wu, Jiaxi, et autres
Publié: (2025)

Upper and Lower Bounds for Distributionally Robust Off-Dynamics Reinforcement Learning
par: Liu, Zhishuai, et autres
Publié: (2024)

Robust Deep Reinforcement Learning with Adaptive Adversarial Perturbations in Action Space
par: Liu, Qianmei, et autres
Publié: (2024)

Multi-Agent Deep Reinforcement Learning Under Constrained Communications
par: Shaik, Shahil, et autres
Publié: (2026)

Label-Free Reinforcement Learning via Cross-Model Entropy
par: Gorbett, Matt, et autres
Publié: (2026)

Multi-fidelity Reinforcement Learning Control for Complex Dynamical Systems
par: Sun, Luning, et autres
Publié: (2025)

GCHR : Goal-Conditioned Hindsight Regularization for Sample-Efficient Reinforcement Learning
par: Lei, Xing, et autres
Publié: (2025)