Record Citations :: Library Catalog

APA (7th ed.) Citation

Solway, A. (2024). Reinforcement Learning without Human Feedback for Last Mile Fine-Tuning of Large Language Models.

Chicago Style (17th ed.) Citation

Solway, Alec. Reinforcement Learning Without Human Feedback for Last Mile Fine-Tuning of Large Language Models. 2024.

MLA (9th ed.) Citation

Solway, Alec. Reinforcement Learning Without Human Feedback for Last Mile Fine-Tuning of Large Language Models. 2024.

Warning: These citations may not always be 100% accurate.