Bartoldson, B., Venkatraman, S., Diffenderfer, J., Jain, M., Ben-Nun, T., Lee, S., . . . Kailkhura, B. (2025). Trajectory Balance with Asynchrony: Decoupling Exploration and Learning for Fast, Scalable LLM Post-Training.
Chicago-Zitierstil (17. Ausg.)Bartoldson, Brian, et al. Trajectory Balance with Asynchrony: Decoupling Exploration and Learning for Fast, Scalable LLM Post-Training. 2025.
MLA-Zitierstil (9. Ausg.)Bartoldson, Brian, et al. Trajectory Balance with Asynchrony: Decoupling Exploration and Learning for Fast, Scalable LLM Post-Training. 2025.
Achtung: Diese Zitate sind unter Umständen nicht zu 100% korrekt.