Salvato in:
| Autori principali: | Waddington, Daniel, Constantinescu, Cornel |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2025
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2505.09810 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
Lossless and Near-Lossless Compression for Foundation Models
di: Hershcovitch, Moshik, et al.
Pubblicazione: (2024)
di: Hershcovitch, Moshik, et al.
Pubblicazione: (2024)
Huff-LLM: End-to-End Lossless Compression for Efficient LLM Inference
di: Yubeaton, Patrick, et al.
Pubblicazione: (2025)
di: Yubeaton, Patrick, et al.
Pubblicazione: (2025)
Proximity to Losslessly Compressible Parameters
di: Farrugia-Roberts, Matthew
Pubblicazione: (2023)
di: Farrugia-Roberts, Matthew
Pubblicazione: (2023)
Lossless Compression of Vector IDs for Approximate Nearest Neighbor Search
di: Severo, Daniel, et al.
Pubblicazione: (2025)
di: Severo, Daniel, et al.
Pubblicazione: (2025)
Random Cycle Coding: Lossless Compression of Cluster Assignments via Bits-Back Coding
di: Severo, Daniel, et al.
Pubblicazione: (2024)
di: Severo, Daniel, et al.
Pubblicazione: (2024)
ZipNN: Lossless Compression for AI Models
di: Hershcovitch, Moshik, et al.
Pubblicazione: (2024)
di: Hershcovitch, Moshik, et al.
Pubblicazione: (2024)
LoMA: Lossless Compressed Memory Attention
di: Wang, Yumeng, et al.
Pubblicazione: (2024)
di: Wang, Yumeng, et al.
Pubblicazione: (2024)
KeepKV: Achieving Periodic Lossless KV Cache Compression for Efficient LLM Inference
di: Tian, Yuxuan, et al.
Pubblicazione: (2025)
di: Tian, Yuxuan, et al.
Pubblicazione: (2025)
GEAR: An Efficient KV Cache Compression Recipe for Near-Lossless Generative Inference of LLM
di: Kang, Hao, et al.
Pubblicazione: (2024)
di: Kang, Hao, et al.
Pubblicazione: (2024)
SplitZip: Ultra Fast Lossless KV Compression for Disaggregated LLM Serving
di: Guo, Yipin, et al.
Pubblicazione: (2026)
di: Guo, Yipin, et al.
Pubblicazione: (2026)
To Compress or Not? Pushing the Frontier of Lossless GenAI Model Weights Compression with Exponent Concentration
di: Yang, Zeyu, et al.
Pubblicazione: (2025)
di: Yang, Zeyu, et al.
Pubblicazione: (2025)
Communication Compression for Tensor Parallel LLM Inference
di: Hansen-Palmus, Jan, et al.
Pubblicazione: (2024)
di: Hansen-Palmus, Jan, et al.
Pubblicazione: (2024)
Lossless Token Sequence Compression via Meta-Tokens
di: Harvill, John, et al.
Pubblicazione: (2025)
di: Harvill, John, et al.
Pubblicazione: (2025)
ZipServ: Fast and Memory-Efficient LLM Inference with Hardware-Aware Lossless Compression
di: Fan, Ruibo, et al.
Pubblicazione: (2026)
di: Fan, Ruibo, et al.
Pubblicazione: (2026)
Lossless Compression: A New Benchmark for Time Series Model Evaluation
di: Wan, Meng, et al.
Pubblicazione: (2025)
di: Wan, Meng, et al.
Pubblicazione: (2025)
Lossless Compression via Chained Lightweight Neural Predictors with Information Inheritance
di: Kim, Yuriy, et al.
Pubblicazione: (2026)
di: Kim, Yuriy, et al.
Pubblicazione: (2026)
Quad Length Codes for Lossless Compression of e4m3
di: Agrawal, Aditya, et al.
Pubblicazione: (2026)
di: Agrawal, Aditya, et al.
Pubblicazione: (2026)
AlphaZip: Neural Network-Enhanced Lossless Text Compression
di: Narashiman, Swathi Shree, et al.
Pubblicazione: (2024)
di: Narashiman, Swathi Shree, et al.
Pubblicazione: (2024)
Llamazip: Leveraging LLaMA for Lossless Text Compression and Training Dataset Detection
di: Dréano, Sören, et al.
Pubblicazione: (2025)
di: Dréano, Sören, et al.
Pubblicazione: (2025)
"Lossless" Compression of Deep Neural Networks: A High-dimensional Neural Tangent Kernel Approach
di: Gu, Lingyu, et al.
Pubblicazione: (2024)
di: Gu, Lingyu, et al.
Pubblicazione: (2024)
Lossless Model Compression via Joint Low-Rank Factorization Optimization
di: Zhang, Boyang, et al.
Pubblicazione: (2024)
di: Zhang, Boyang, et al.
Pubblicazione: (2024)
Accelerating LLM Inference with Lossless Speculative Decoding Algorithms for Heterogeneous Vocabularies
di: Timor, Nadav, et al.
Pubblicazione: (2025)
di: Timor, Nadav, et al.
Pubblicazione: (2025)
Off Policy Lyapunov Stability in Reinforcement Learning
di: Gill, Sarvan, et al.
Pubblicazione: (2025)
di: Gill, Sarvan, et al.
Pubblicazione: (2025)
Benchmarking Language Modeling for Lossless Compression of Full-Fidelity Audio
di: Long, Phillip, et al.
Pubblicazione: (2026)
di: Long, Phillip, et al.
Pubblicazione: (2026)
Lossless Compression of Large Language Model-Generated Text via Next-Token Prediction
di: Mao, Yu, et al.
Pubblicazione: (2025)
di: Mao, Yu, et al.
Pubblicazione: (2025)
TurboAngle: Near-Lossless KV Cache Compression via Uniform Angle Quantization
di: Patel, Dipkumar
Pubblicazione: (2026)
di: Patel, Dipkumar
Pubblicazione: (2026)
TensorLLM: Tensorising Multi-Head Attention for Enhanced Reasoning and Compression in LLMs
di: Gu, Yuxuan, et al.
Pubblicazione: (2025)
di: Gu, Yuxuan, et al.
Pubblicazione: (2025)
70% Size, 100% Accuracy: Lossless LLM Compression for Efficient GPU Inference via Dynamic-Length Float (DFloat11)
di: Zhang, Tianyi, et al.
Pubblicazione: (2025)
di: Zhang, Tianyi, et al.
Pubblicazione: (2025)
LatentLLM: Attention-Aware Joint Tensor Compression
di: Koike-Akino, Toshiaki, et al.
Pubblicazione: (2025)
di: Koike-Akino, Toshiaki, et al.
Pubblicazione: (2025)
Lossless Image Compression Using Multi-level Dictionaries: Binary Images
di: Agnihotri, Samar, et al.
Pubblicazione: (2024)
di: Agnihotri, Samar, et al.
Pubblicazione: (2024)
VeriCache: Turning Lossy KV Cache into Lossless LLM Inference
di: Yao, Jiayi, et al.
Pubblicazione: (2026)
di: Yao, Jiayi, et al.
Pubblicazione: (2026)
Users Favor LLM-Generated Content -- Until They Know It's AI
di: Parshakov, Petr, et al.
Pubblicazione: (2025)
di: Parshakov, Petr, et al.
Pubblicazione: (2025)
Approximation and interpolation of deep neural networks
di: Constantinescu, Vlad-Raul, et al.
Pubblicazione: (2023)
di: Constantinescu, Vlad-Raul, et al.
Pubblicazione: (2023)
Learning Lossless Compression for High Bit-Depth Volumetric Medical Image
di: Wang, Kai, et al.
Pubblicazione: (2024)
di: Wang, Kai, et al.
Pubblicazione: (2024)
SamBaTen: Sampling-based Batch Incremental Tensor Decomposition
di: Gujral, Ekta, et al.
Pubblicazione: (2017)
di: Gujral, Ekta, et al.
Pubblicazione: (2017)
FineZip : Pushing the Limits of Large Language Models for Practical Lossless Text Compression
di: Mittu, Fazal, et al.
Pubblicazione: (2024)
di: Mittu, Fazal, et al.
Pubblicazione: (2024)
Lossless Point Cloud Geometry and Attribute Compression Using a Learned Conditional Probability Model
di: Nguyen, Dat Thanh, et al.
Pubblicazione: (2023)
di: Nguyen, Dat Thanh, et al.
Pubblicazione: (2023)
Compressing Structured Tensor Algebra
di: Ghorbani, Mahdi, et al.
Pubblicazione: (2024)
di: Ghorbani, Mahdi, et al.
Pubblicazione: (2024)
Accelerating Distributed Deep Learning using Lossless Homomorphic Compression
di: Li, Haoyu, et al.
Pubblicazione: (2024)
di: Li, Haoyu, et al.
Pubblicazione: (2024)
Symbolic Snapshot Ensembles
di: Liu, Mingyue, et al.
Pubblicazione: (2025)
di: Liu, Mingyue, et al.
Pubblicazione: (2025)
Documenti analoghi
-
Lossless and Near-Lossless Compression for Foundation Models
di: Hershcovitch, Moshik, et al.
Pubblicazione: (2024) -
Huff-LLM: End-to-End Lossless Compression for Efficient LLM Inference
di: Yubeaton, Patrick, et al.
Pubblicazione: (2025) -
Proximity to Losslessly Compressible Parameters
di: Farrugia-Roberts, Matthew
Pubblicazione: (2023) -
Lossless Compression of Vector IDs for Approximate Nearest Neighbor Search
di: Severo, Daniel, et al.
Pubblicazione: (2025) -
Random Cycle Coding: Lossless Compression of Cluster Assignments via Bits-Back Coding
di: Severo, Daniel, et al.
Pubblicazione: (2024)