Salvato in:
| Autori principali: | Liu, Wenhui, Wu, Zhijian, Wang, Jingchao, Huang, Dingjiang, Zhou, Shuigeng |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2025
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2505.12211 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
In-Context Compositional Q-Learning for Offline Reinforcement Learning
di: Xu, Qiushui, et al.
Pubblicazione: (2025)
di: Xu, Qiushui, et al.
Pubblicazione: (2025)
Adaptive Neighborhood-Constrained Q Learning for Offline Reinforcement Learning
di: Mao, Yixiu, et al.
Pubblicazione: (2025)
di: Mao, Yixiu, et al.
Pubblicazione: (2025)
Mildly Conservative Q-Learning for Offline Reinforcement Learning
di: Lyu, Jiafei, et al.
Pubblicazione: (2022)
di: Lyu, Jiafei, et al.
Pubblicazione: (2022)
ACL-QL: Adaptive Conservative Level in Q-Learning for Offline Reinforcement Learning
di: Wu, Kun, et al.
Pubblicazione: (2024)
di: Wu, Kun, et al.
Pubblicazione: (2024)
Exclusively Penalized Q-learning for Offline Reinforcement Learning
di: Yeom, Junghyuk, et al.
Pubblicazione: (2024)
di: Yeom, Junghyuk, et al.
Pubblicazione: (2024)
Improving Offline-to-Online Reinforcement Learning with Q Conditioned State Entropy Exploration
di: Zhang, Ziqi, et al.
Pubblicazione: (2023)
di: Zhang, Ziqi, et al.
Pubblicazione: (2023)
On the Complexity of Offline Reinforcement Learning with $Q^\star$-Approximation and Partial Coverage
di: Liu, Haolin, et al.
Pubblicazione: (2026)
di: Liu, Haolin, et al.
Pubblicazione: (2026)
Unlocking the Potential of MLLMs in Referring Expression Segmentation via a Light-weight Mask Decoder
di: Wang, Jingchao, et al.
Pubblicazione: (2025)
di: Wang, Jingchao, et al.
Pubblicazione: (2025)
Model-based Offline Reinforcement Learning with Lower Expectile Q-Learning
di: Park, Kwanyoung, et al.
Pubblicazione: (2024)
di: Park, Kwanyoung, et al.
Pubblicazione: (2024)
Causal Flow Q-Learning for Robust Offline Reinforcement Learning
di: Li, Mingxuan, et al.
Pubblicazione: (2026)
di: Li, Mingxuan, et al.
Pubblicazione: (2026)
ENOTO: Improving Offline-to-Online Reinforcement Learning with Q-Ensembles
di: Zhao, Kai, et al.
Pubblicazione: (2023)
di: Zhao, Kai, et al.
Pubblicazione: (2023)
PIQL: Projective Implicit Q-Learning with Support Constraint for Offline Reinforcement Learning
di: Han, Xinchen, et al.
Pubblicazione: (2025)
di: Han, Xinchen, et al.
Pubblicazione: (2025)
Learning Spectral Diffusion Prior for Hyperspectral Image Reconstruction
di: Yu, Mingyang, et al.
Pubblicazione: (2025)
di: Yu, Mingyang, et al.
Pubblicazione: (2025)
FORLER: Federated Offline Reinforcement Learning with Q-Ensemble and Actor Rectification
di: Qiao, Nan, et al.
Pubblicazione: (2026)
di: Qiao, Nan, et al.
Pubblicazione: (2026)
Offline Trajectory Optimization for Offline Reinforcement Learning
di: Zhao, Ziqi, et al.
Pubblicazione: (2024)
di: Zhao, Ziqi, et al.
Pubblicazione: (2024)
Goal-Conditioned Data Augmentation for Offline Reinforcement Learning
di: Huang, Xingshuai, et al.
Pubblicazione: (2024)
di: Huang, Xingshuai, et al.
Pubblicazione: (2024)
Pretraining a Shared Q-Network for Data-Efficient Offline Reinforcement Learning
di: Park, Jongchan, et al.
Pubblicazione: (2025)
di: Park, Jongchan, et al.
Pubblicazione: (2025)
FlowQ: Energy-Guided Flow Policies for Offline Reinforcement Learning
di: Alles, Marvin, et al.
Pubblicazione: (2025)
di: Alles, Marvin, et al.
Pubblicazione: (2025)
Safe Flow Q-Learning: Offline Safe Reinforcement Learning with Reachability-Based Flow Policies
di: Tayal, Mumuksh, et al.
Pubblicazione: (2026)
di: Tayal, Mumuksh, et al.
Pubblicazione: (2026)
Policy-regularized Offline Multi-objective Reinforcement Learning
di: Lin, Qian, et al.
Pubblicazione: (2024)
di: Lin, Qian, et al.
Pubblicazione: (2024)
Provable Zero-Shot Generalization in Offline Reinforcement Learning
di: Wang, Zhiyong, et al.
Pubblicazione: (2025)
di: Wang, Zhiyong, et al.
Pubblicazione: (2025)
Dataset Distillation for Offline Reinforcement Learning
di: Light, Jonathan, et al.
Pubblicazione: (2024)
di: Light, Jonathan, et al.
Pubblicazione: (2024)
SPEQ: Offline Stabilization Phases for Efficient Q-Learning in High Update-To-Data Ratio Reinforcement Learning
di: Romeo, Carlo, et al.
Pubblicazione: (2025)
di: Romeo, Carlo, et al.
Pubblicazione: (2025)
Belief-Based Offline Reinforcement Learning for Delay-Robust Policy Optimization
di: Zhan, Simon Sinong, et al.
Pubblicazione: (2025)
di: Zhan, Simon Sinong, et al.
Pubblicazione: (2025)
Offline-to-Online Reinforcement Learning with Classifier-Free Diffusion Generation
di: Huang, Xiao, et al.
Pubblicazione: (2025)
di: Huang, Xiao, et al.
Pubblicazione: (2025)
Diffusion Policies creating a Trust Region for Offline Reinforcement Learning
di: Chen, Tianyu, et al.
Pubblicazione: (2024)
di: Chen, Tianyu, et al.
Pubblicazione: (2024)
KAN v.s. MLP for Offline Reinforcement Learning
di: Guo, Haihong, et al.
Pubblicazione: (2024)
di: Guo, Haihong, et al.
Pubblicazione: (2024)
IPD: Boosting Sequential Policy with Imaginary Planning Distillation in Offline Reinforcement Learning
di: Qin, Yihao, et al.
Pubblicazione: (2026)
di: Qin, Yihao, et al.
Pubblicazione: (2026)
Grid-Mapping Pseudo-Count Constraint for Offline Reinforcement Learning
di: Shen, Yi, et al.
Pubblicazione: (2024)
di: Shen, Yi, et al.
Pubblicazione: (2024)
Offline Reinforcement Learning with Generative Trajectory Policies
di: Feng, Xinsong, et al.
Pubblicazione: (2025)
di: Feng, Xinsong, et al.
Pubblicazione: (2025)
Solving Continual Offline Reinforcement Learning with Decision Transformer
di: Huang, Kaixin, et al.
Pubblicazione: (2024)
di: Huang, Kaixin, et al.
Pubblicazione: (2024)
Improving Offline Reinforcement Learning with Inaccurate Simulators
di: Hou, Yiwen, et al.
Pubblicazione: (2024)
di: Hou, Yiwen, et al.
Pubblicazione: (2024)
Doubly Mild Generalization for Offline Reinforcement Learning
di: Mao, Yixiu, et al.
Pubblicazione: (2024)
di: Mao, Yixiu, et al.
Pubblicazione: (2024)
LEASE: Offline Preference-based Reinforcement Learning with High Sample Efficiency
di: Liu, Xiao-Yin, et al.
Pubblicazione: (2024)
di: Liu, Xiao-Yin, et al.
Pubblicazione: (2024)
Boundary-to-Region Supervision for Offline Safe Reinforcement Learning
di: Su, Huikang, et al.
Pubblicazione: (2025)
di: Su, Huikang, et al.
Pubblicazione: (2025)
Preference Elicitation for Offline Reinforcement Learning
di: Pace, Alizée, et al.
Pubblicazione: (2024)
di: Pace, Alizée, et al.
Pubblicazione: (2024)
Offline Reinforcement Learning with Imbalanced Datasets
di: Jiang, Li, et al.
Pubblicazione: (2023)
di: Jiang, Li, et al.
Pubblicazione: (2023)
Simple Ingredients for Offline Reinforcement Learning
di: Cetin, Edoardo, et al.
Pubblicazione: (2024)
di: Cetin, Edoardo, et al.
Pubblicazione: (2024)
State-Constrained Offline Reinforcement Learning
di: Hepburn, Charles A., et al.
Pubblicazione: (2024)
di: Hepburn, Charles A., et al.
Pubblicazione: (2024)
The Generalization Gap in Offline Reinforcement Learning
di: Mediratta, Ishita, et al.
Pubblicazione: (2023)
di: Mediratta, Ishita, et al.
Pubblicazione: (2023)
Documenti analoghi
-
In-Context Compositional Q-Learning for Offline Reinforcement Learning
di: Xu, Qiushui, et al.
Pubblicazione: (2025) -
Adaptive Neighborhood-Constrained Q Learning for Offline Reinforcement Learning
di: Mao, Yixiu, et al.
Pubblicazione: (2025) -
Mildly Conservative Q-Learning for Offline Reinforcement Learning
di: Lyu, Jiafei, et al.
Pubblicazione: (2022) -
ACL-QL: Adaptive Conservative Level in Q-Learning for Offline Reinforcement Learning
di: Wu, Kun, et al.
Pubblicazione: (2024) -
Exclusively Penalized Q-learning for Offline Reinforcement Learning
di: Yeom, Junghyuk, et al.
Pubblicazione: (2024)