Record Citations :: Library Catalog

APA (7th ed.) Citation

Jiang, Z., Zhao, K., Xu, W., Lin, X., Liu, W., Luan, J., . . . Han, P. (2026). R^3: Replay, Reflection, and Ranking Rewards for LLM Reinforcement Learning.

Chicago Style (17th ed.) Citation

Jiang, Zhizheng, Kang Zhao, Weikai Xu, Xinkui Lin, Wei Liu, Jian Luan, Shuo Shang, and Peng Han. R^3: Replay, Reflection, and Ranking Rewards for LLM Reinforcement Learning. 2026.

MLA (9th ed.) Citation

Jiang, Zhizheng, et al. R^3: Replay, Reflection, and Ranking Rewards for LLM Reinforcement Learning. 2026.

Warning: These citations may not always be 100% accurate.