APA-Zitierstil (7. Ausg.)

Chen, X., Shen, Y., Yang, S., Li, C., Yang, G., & Wang, W. (2026). Behavior-Induced Mirror-Prox Temporal-Difference Learning for Faster Off-Policy Prediction.

Chicago-Zitierstil (17. Ausg.)

Chen, Xingguo, Yuchen Shen, Shangdong Yang, Chao Li, Guang Yang, und Wenhao Wang. Behavior-Induced Mirror-Prox Temporal-Difference Learning for Faster Off-Policy Prediction. 2026.

MLA-Zitierstil (9. Ausg.)

Chen, Xingguo, et al. Behavior-Induced Mirror-Prox Temporal-Difference Learning for Faster Off-Policy Prediction. 2026.

Achtung: Diese Zitate sind unter Umständen nicht zu 100% korrekt.