Enregistré dans:
| Auteurs principaux: | Wang, Yudan, Zou, Shaofeng, Wang, Yue |
|---|---|
| Format: | Preprint |
| Publié: |
2024
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2406.17096 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
Non-Asymptotic Analysis for Single-Loop (Natural) Actor-Critic with Compatible Function Approximation
par: Wang, Yudan, et autres
Publié: (2024)
par: Wang, Yudan, et autres
Publié: (2024)
Achieving the Asymptotically Optimal Sample Complexity of Offline Reinforcement Learning: A DRO-Based Approach
par: Wang, Yue, et autres
Publié: (2023)
par: Wang, Yue, et autres
Publié: (2023)
Sample Complexity of Distributionally Robust Off-Dynamics Reinforcement Learning with Online Interaction
par: He, Yiting, et autres
Publié: (2025)
par: He, Yiting, et autres
Publié: (2025)
Sample Complexity Analysis for Constrained Bilevel Reinforcement Learning
par: Saxena, Naman, et autres
Publié: (2026)
par: Saxena, Naman, et autres
Publié: (2026)
RLVR-World: Training World Models with Reinforcement Learning
par: Wu, Jialong, et autres
Publié: (2025)
par: Wu, Jialong, et autres
Publié: (2025)
Theoretical Study of Conflict-Avoidant Multi-Objective Reinforcement Learning
par: Wang, Yudan, et autres
Publié: (2024)
par: Wang, Yudan, et autres
Publié: (2024)
CADENT: Gated Hybrid Distillation for Sample-Efficient Transfer in Reinforcement Learning
par: Alinejad, Mahyar, et autres
Publié: (2026)
par: Alinejad, Mahyar, et autres
Publié: (2026)
Detector-Evasive LLM Paraphrasing via Constrained Policy Optimization
par: Wang, Mingyi, et autres
Publié: (2026)
par: Wang, Mingyi, et autres
Publié: (2026)
On The Sample Complexity Bounds In Bilevel Reinforcement Learning
par: Gaur, Mudit, et autres
Publié: (2025)
par: Gaur, Mudit, et autres
Publié: (2025)
GILT: An LLM-Free, Tuning-Free Graph Foundational Model for In-Context Learning
par: Ma, Weishuo, et autres
Publié: (2025)
par: Ma, Weishuo, et autres
Publié: (2025)
HIPO: Instruction Hierarchy via Constrained Reinforcement Learning
par: Chen, Keru, et autres
Publié: (2026)
par: Chen, Keru, et autres
Publié: (2026)
Why Adam Can Beat SGD: Second-Moment Normalization Yields Sharper Tails
par: Jin, Ruinan, et autres
Publié: (2026)
par: Jin, Ruinan, et autres
Publié: (2026)
Speculative Sampling with Reinforcement Learning
par: Wang, Chenan, et autres
Publié: (2026)
par: Wang, Chenan, et autres
Publié: (2026)
Step-level Denoising-time Diffusion Alignment with Multiple Objectives
par: Zhang, Qi, et autres
Publié: (2026)
par: Zhang, Qi, et autres
Publié: (2026)
Near-Optimal Sample Complexity for Iterated CVaR Reinforcement Learning with a Generative Model
par: Deng, Zilong, et autres
Publié: (2025)
par: Deng, Zilong, et autres
Publié: (2025)
RIME: Robust Preference-based Reinforcement Learning with Noisy Preferences
par: Cheng, Jie, et autres
Publié: (2024)
par: Cheng, Jie, et autres
Publié: (2024)
On the Statistical Complexity for Offline and Low-Adaptive Reinforcement Learning with Structures
par: Yin, Ming, et autres
Publié: (2025)
par: Yin, Ming, et autres
Publié: (2025)
Projection by Convolution: Optimal Sample Complexity for Reinforcement Learning in Continuous-Space MDPs
par: Maran, Davide, et autres
Publié: (2024)
par: Maran, Davide, et autres
Publié: (2024)
Sample Complexity Reduction via Policy Difference Estimation in Tabular Reinforcement Learning
par: Narang, Adhyyan, et autres
Publié: (2024)
par: Narang, Adhyyan, et autres
Publié: (2024)
Sparse-Reg: Improving Sample Complexity in Offline Reinforcement Learning using Sparsity
par: Arnob, Samin Yeasar, et autres
Publié: (2025)
par: Arnob, Samin Yeasar, et autres
Publié: (2025)
WOMBET: World Model-based Experience Transfer for Robust and Sample-efficient Reinforcement Learning
par: Kim, Mintae, et autres
Publié: (2026)
par: Kim, Mintae, et autres
Publié: (2026)
Dynamic Adversarial Reinforcement Learning for Robust Multimodal Large Language Models
par: Bao, Yicheng, et autres
Publié: (2026)
par: Bao, Yicheng, et autres
Publié: (2026)
Interpreting Emergent Planning in Model-Free Reinforcement Learning
par: Bush, Thomas, et autres
Publié: (2025)
par: Bush, Thomas, et autres
Publié: (2025)
Towards General-Purpose Model-Free Reinforcement Learning
par: Fujimoto, Scott, et autres
Publié: (2025)
par: Fujimoto, Scott, et autres
Publié: (2025)
Sample and Computationally Efficient Continuous-Time Reinforcement Learning with General Function Approximation
par: Zhao, Runze, et autres
Publié: (2025)
par: Zhao, Runze, et autres
Publié: (2025)
Towards Robust Deep Reinforcement Learning against Environmental State Perturbation
par: Wang, Chenxu, et autres
Publié: (2025)
par: Wang, Chenxu, et autres
Publié: (2025)
Drama: Mamba-Enabled Model-Based Reinforcement Learning Is Sample and Parameter Efficient
par: Wang, Wenlong, et autres
Publié: (2024)
par: Wang, Wenlong, et autres
Publié: (2024)
RLAF: Reinforcement Learning from Automaton Feedback
par: Alinejad, Mahyar, et autres
Publié: (2025)
par: Alinejad, Mahyar, et autres
Publié: (2025)
Task-Distributionally Robust Data-Free Meta-Learning
par: Hu, Zixuan, et autres
Publié: (2023)
par: Hu, Zixuan, et autres
Publié: (2023)
Data-Free Continual Learning of Server Models in Model-Heterogeneous Cloud-Device Collaboration
par: Zhang, Xiao, et autres
Publié: (2025)
par: Zhang, Xiao, et autres
Publié: (2025)
Diffusion Models for Reinforcement Learning: Foundations, Taxonomy, and Development
par: Xu, Changfu, et autres
Publié: (2025)
par: Xu, Changfu, et autres
Publié: (2025)
Robust Model-Based Reinforcement Learning with an Adversarial Auxiliary Model
par: Herremans, Siemen, et autres
Publié: (2024)
par: Herremans, Siemen, et autres
Publié: (2024)
Multi-State TD Target for Model-Free Reinforcement Learning
par: Wang, Wuhao, et autres
Publié: (2024)
par: Wang, Wuhao, et autres
Publié: (2024)
UACER: An Uncertainty-Adaptive Critic Ensemble Framework for Robust Adversarial Reinforcement Learning
par: Wu, Jiaxi, et autres
Publié: (2025)
par: Wu, Jiaxi, et autres
Publié: (2025)
Upper and Lower Bounds for Distributionally Robust Off-Dynamics Reinforcement Learning
par: Liu, Zhishuai, et autres
Publié: (2024)
par: Liu, Zhishuai, et autres
Publié: (2024)
Robust Deep Reinforcement Learning with Adaptive Adversarial Perturbations in Action Space
par: Liu, Qianmei, et autres
Publié: (2024)
par: Liu, Qianmei, et autres
Publié: (2024)
Multi-Agent Deep Reinforcement Learning Under Constrained Communications
par: Shaik, Shahil, et autres
Publié: (2026)
par: Shaik, Shahil, et autres
Publié: (2026)
Label-Free Reinforcement Learning via Cross-Model Entropy
par: Gorbett, Matt, et autres
Publié: (2026)
par: Gorbett, Matt, et autres
Publié: (2026)
Multi-fidelity Reinforcement Learning Control for Complex Dynamical Systems
par: Sun, Luning, et autres
Publié: (2025)
par: Sun, Luning, et autres
Publié: (2025)
GCHR : Goal-Conditioned Hindsight Regularization for Sample-Efficient Reinforcement Learning
par: Lei, Xing, et autres
Publié: (2025)
par: Lei, Xing, et autres
Publié: (2025)
Documents similaires
-
Non-Asymptotic Analysis for Single-Loop (Natural) Actor-Critic with Compatible Function Approximation
par: Wang, Yudan, et autres
Publié: (2024) -
Achieving the Asymptotically Optimal Sample Complexity of Offline Reinforcement Learning: A DRO-Based Approach
par: Wang, Yue, et autres
Publié: (2023) -
Sample Complexity of Distributionally Robust Off-Dynamics Reinforcement Learning with Online Interaction
par: He, Yiting, et autres
Publié: (2025) -
Sample Complexity Analysis for Constrained Bilevel Reinforcement Learning
par: Saxena, Naman, et autres
Publié: (2026) -
RLVR-World: Training World Models with Reinforcement Learning
par: Wu, Jialong, et autres
Publié: (2025)