:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autori principali:	Liu, Wenhui, Wu, Zhijian, Wang, Jingchao, Huang, Dingjiang, Zhou, Shuigeng
Natura:	Preprint
Pubblicazione:	2025
Soggetti:	Machine Learning Artificial Intelligence
Accesso online:	https://arxiv.org/abs/2505.12211
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

In-Context Compositional Q-Learning for Offline Reinforcement Learning
di: Xu, Qiushui, et al.
Pubblicazione: (2025)

Adaptive Neighborhood-Constrained Q Learning for Offline Reinforcement Learning
di: Mao, Yixiu, et al.
Pubblicazione: (2025)

Mildly Conservative Q-Learning for Offline Reinforcement Learning
di: Lyu, Jiafei, et al.
Pubblicazione: (2022)

ACL-QL: Adaptive Conservative Level in Q-Learning for Offline Reinforcement Learning
di: Wu, Kun, et al.
Pubblicazione: (2024)

Exclusively Penalized Q-learning for Offline Reinforcement Learning
di: Yeom, Junghyuk, et al.
Pubblicazione: (2024)

Improving Offline-to-Online Reinforcement Learning with Q Conditioned State Entropy Exploration
di: Zhang, Ziqi, et al.
Pubblicazione: (2023)

On the Complexity of Offline Reinforcement Learning with $Q^\star$-Approximation and Partial Coverage
di: Liu, Haolin, et al.
Pubblicazione: (2026)

Unlocking the Potential of MLLMs in Referring Expression Segmentation via a Light-weight Mask Decoder
di: Wang, Jingchao, et al.
Pubblicazione: (2025)

Model-based Offline Reinforcement Learning with Lower Expectile Q-Learning
di: Park, Kwanyoung, et al.
Pubblicazione: (2024)

Causal Flow Q-Learning for Robust Offline Reinforcement Learning
di: Li, Mingxuan, et al.
Pubblicazione: (2026)

ENOTO: Improving Offline-to-Online Reinforcement Learning with Q-Ensembles
di: Zhao, Kai, et al.
Pubblicazione: (2023)

PIQL: Projective Implicit Q-Learning with Support Constraint for Offline Reinforcement Learning
di: Han, Xinchen, et al.
Pubblicazione: (2025)

Learning Spectral Diffusion Prior for Hyperspectral Image Reconstruction
di: Yu, Mingyang, et al.
Pubblicazione: (2025)

FORLER: Federated Offline Reinforcement Learning with Q-Ensemble and Actor Rectification
di: Qiao, Nan, et al.
Pubblicazione: (2026)

Offline Trajectory Optimization for Offline Reinforcement Learning
di: Zhao, Ziqi, et al.
Pubblicazione: (2024)

Goal-Conditioned Data Augmentation for Offline Reinforcement Learning
di: Huang, Xingshuai, et al.
Pubblicazione: (2024)

Pretraining a Shared Q-Network for Data-Efficient Offline Reinforcement Learning
di: Park, Jongchan, et al.
Pubblicazione: (2025)

FlowQ: Energy-Guided Flow Policies for Offline Reinforcement Learning
di: Alles, Marvin, et al.
Pubblicazione: (2025)

Safe Flow Q-Learning: Offline Safe Reinforcement Learning with Reachability-Based Flow Policies
di: Tayal, Mumuksh, et al.
Pubblicazione: (2026)

Policy-regularized Offline Multi-objective Reinforcement Learning
di: Lin, Qian, et al.
Pubblicazione: (2024)

Provable Zero-Shot Generalization in Offline Reinforcement Learning
di: Wang, Zhiyong, et al.
Pubblicazione: (2025)

Dataset Distillation for Offline Reinforcement Learning
di: Light, Jonathan, et al.
Pubblicazione: (2024)

SPEQ: Offline Stabilization Phases for Efficient Q-Learning in High Update-To-Data Ratio Reinforcement Learning
di: Romeo, Carlo, et al.
Pubblicazione: (2025)

Belief-Based Offline Reinforcement Learning for Delay-Robust Policy Optimization
di: Zhan, Simon Sinong, et al.
Pubblicazione: (2025)

Offline-to-Online Reinforcement Learning with Classifier-Free Diffusion Generation
di: Huang, Xiao, et al.
Pubblicazione: (2025)

Diffusion Policies creating a Trust Region for Offline Reinforcement Learning
di: Chen, Tianyu, et al.
Pubblicazione: (2024)

KAN v.s. MLP for Offline Reinforcement Learning
di: Guo, Haihong, et al.
Pubblicazione: (2024)

IPD: Boosting Sequential Policy with Imaginary Planning Distillation in Offline Reinforcement Learning
di: Qin, Yihao, et al.
Pubblicazione: (2026)

Grid-Mapping Pseudo-Count Constraint for Offline Reinforcement Learning
di: Shen, Yi, et al.
Pubblicazione: (2024)

Offline Reinforcement Learning with Generative Trajectory Policies
di: Feng, Xinsong, et al.
Pubblicazione: (2025)

Solving Continual Offline Reinforcement Learning with Decision Transformer
di: Huang, Kaixin, et al.
Pubblicazione: (2024)

Improving Offline Reinforcement Learning with Inaccurate Simulators
di: Hou, Yiwen, et al.
Pubblicazione: (2024)

Doubly Mild Generalization for Offline Reinforcement Learning
di: Mao, Yixiu, et al.
Pubblicazione: (2024)

LEASE: Offline Preference-based Reinforcement Learning with High Sample Efficiency
di: Liu, Xiao-Yin, et al.
Pubblicazione: (2024)

Boundary-to-Region Supervision for Offline Safe Reinforcement Learning
di: Su, Huikang, et al.
Pubblicazione: (2025)

Preference Elicitation for Offline Reinforcement Learning
di: Pace, Alizée, et al.
Pubblicazione: (2024)

Offline Reinforcement Learning with Imbalanced Datasets
di: Jiang, Li, et al.
Pubblicazione: (2023)

Simple Ingredients for Offline Reinforcement Learning
di: Cetin, Edoardo, et al.
Pubblicazione: (2024)

State-Constrained Offline Reinforcement Learning
di: Hepburn, Charles A., et al.
Pubblicazione: (2024)

The Generalization Gap in Offline Reinforcement Learning
di: Mediratta, Ishita, et al.
Pubblicazione: (2023)