Xu, Y., Ye, X., Chen, Y., & Zhang, Q. (2025). When Human Preferences Flip: An Instance-Dependent Robust Loss for RLHF.
Chicago-Zitierstil (17. Ausg.)Xu, Yifan, Xichen Ye, Yifan Chen, und Qiaosheng Zhang. When Human Preferences Flip: An Instance-Dependent Robust Loss for RLHF. 2025.
MLA-Zitierstil (9. Ausg.)Xu, Yifan, et al. When Human Preferences Flip: An Instance-Dependent Robust Loss for RLHF. 2025.
Achtung: Diese Zitate sind unter Umständen nicht zu 100% korrekt.