Zhang, J., Xu, D., Wang, C., Xie, W., Qi, T., Ma, Y., . . . Huang, G. (2026). Quant.npu: Enabling Efficient Mobile NPU Inference for on-device LLMs via Fully Static Quantization.
Citazione stile Chigago Style (17a edizione)Zhang, Jinghe, Daliang Xu, Chenghua Wang, Weikai Xie, Tao Qi, Yun Ma, Mengwei Xu, e Gang Huang. Quant.npu: Enabling Efficient Mobile NPU Inference for On-device LLMs via Fully Static Quantization. 2026.
Citatione MLA (9a ed.)Zhang, Jinghe, et al. Quant.npu: Enabling Efficient Mobile NPU Inference for On-device LLMs via Fully Static Quantization. 2026.
Attenzione: Queste citazioni potrebbero non essere precise al 100%.