Chen, X., Shen, Y., Yang, S., Li, C., Yang, G., & Wang, W. (2026). Behavior-Induced Mirror-Prox Temporal-Difference Learning for Faster Off-Policy Prediction.
Chicago-Zitierstil (17. Ausg.)Chen, Xingguo, Yuchen Shen, Shangdong Yang, Chao Li, Guang Yang, und Wenhao Wang. Behavior-Induced Mirror-Prox Temporal-Difference Learning for Faster Off-Policy Prediction. 2026.
MLA-Zitierstil (9. Ausg.)Chen, Xingguo, et al. Behavior-Induced Mirror-Prox Temporal-Difference Learning for Faster Off-Policy Prediction. 2026.
Achtung: Diese Zitate sind unter Umständen nicht zu 100% korrekt.