Hu, P., Li, S., & Huang, L. (2024). Mixed Sparsity Training: Achieving 4$\times$ FLOP Reduction for Transformer Pretraining.
Chicago-Zitierstil (17. Ausg.)Hu, Pihe, Shaolong Li, und Longbo Huang. Mixed Sparsity Training: Achieving 4$\times$ FLOP Reduction for Transformer Pretraining. 2024.
MLA-Zitierstil (9. Ausg.)Hu, Pihe, et al. Mixed Sparsity Training: Achieving 4$\times$ FLOP Reduction for Transformer Pretraining. 2024.
Achtung: Diese Zitate sind unter Umständen nicht zu 100% korrekt.