Nie, B., Fu, Y., Ji, J., & Gao, Y. (2025). Action Robust Reinforcement Learning via Optimal Adversary Aware Policy Optimization.
Chicago-Zitierstil (17. Ausg.)Nie, Buqing, Yangqing Fu, Jingtian Ji, und Yue Gao. Action Robust Reinforcement Learning via Optimal Adversary Aware Policy Optimization. 2025.
MLA-Zitierstil (9. Ausg.)Nie, Buqing, et al. Action Robust Reinforcement Learning via Optimal Adversary Aware Policy Optimization. 2025.
Achtung: Diese Zitate sind unter Umständen nicht zu 100% korrekt.