Jian, C., & Zhu, X. (2025). A First-Order Logic-Based Alternative to Reward Models in RLHF.
Chicago-Zitierstil (17. Ausg.)Jian, Chunjin, und Xinhua Zhu. A First-Order Logic-Based Alternative to Reward Models in RLHF. 2025.
MLA-Zitierstil (9. Ausg.)Jian, Chunjin, und Xinhua Zhu. A First-Order Logic-Based Alternative to Reward Models in RLHF. 2025.
Achtung: Diese Zitate sind unter Umständen nicht zu 100% korrekt.