Wan, Z., Shen, Y., Dou, Z., Zhou, D., Zhang, Y., Wang, X., . . . Zhang, M. (2026). DSDR: Dual-Scale Diversity Regularization for Exploration in LLM Reasoning.
Chicago-Zitierstil (17. Ausg.)Wan, Zhongwei, et al. DSDR: Dual-Scale Diversity Regularization for Exploration in LLM Reasoning. 2026.
MLA-Zitierstil (9. Ausg.)Wan, Zhongwei, et al. DSDR: Dual-Scale Diversity Regularization for Exploration in LLM Reasoning. 2026.
Achtung: Diese Zitate sind unter Umständen nicht zu 100% korrekt.