Chen, P., & Yang, X. (2025). Titanus: Enabling KV Cache Pruning and Quantization On-the-Fly for LLM Acceleration.
Citazione stile Chigago Style (17a edizione)Chen, Peilin, e Xiaoxuan Yang. Titanus: Enabling KV Cache Pruning and Quantization On-the-Fly for LLM Acceleration. 2025.
Citatione MLA (9a ed.)Chen, Peilin, e Xiaoxuan Yang. Titanus: Enabling KV Cache Pruning and Quantization On-the-Fly for LLM Acceleration. 2025.
Attenzione: Queste citazioni potrebbero non essere precise al 100%.