Afzoon, S., Ahmadi, M., Naseem, U., & Beheshti, A. (2026). PersoDPO: Scalable Preference Optimization for Instruction-Adherent, Persona-Grounded Dialogue via Multi-LLM Evaluation.
Trích dẫn kiểu Chicago (xuất bản lần thứ 7)Afzoon, Saleh, MohammadHossein Ahmadi, Usman Naseem, và Amin Beheshti. PersoDPO: Scalable Preference Optimization for Instruction-Adherent, Persona-Grounded Dialogue via Multi-LLM Evaluation. 2026.
Trích dẫn kiểu MLA (xuất bản lần thứ 9)Afzoon, Saleh, et al. PersoDPO: Scalable Preference Optimization for Instruction-Adherent, Persona-Grounded Dialogue via Multi-LLM Evaluation. 2026.
Cảnh báo: Các trích dẫn này có thể không phải lúc nào cũng chính xác 100%.