Zheng, Z., Zhang, H., & Xue, L. (2024). Gap-Dependent Bounds for Q-Learning using Reference-Advantage Decomposition.
Citazione stile Chigago Style (17a edizione)Zheng, Zhong, Haochen Zhang, e Lingzhou Xue. Gap-Dependent Bounds for Q-Learning Using Reference-Advantage Decomposition. 2024.
Citatione MLA (9a ed.)Zheng, Zhong, et al. Gap-Dependent Bounds for Q-Learning Using Reference-Advantage Decomposition. 2024.
Attenzione: Queste citazioni potrebbero non essere precise al 100%.