:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autori principali:	Waddington, Daniel, Constantinescu, Cornel
Natura:	Preprint
Pubblicazione:	2025
Soggetti:	Machine Learning
Accesso online:	https://arxiv.org/abs/2505.09810
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

Lossless and Near-Lossless Compression for Foundation Models
di: Hershcovitch, Moshik, et al.
Pubblicazione: (2024)

Huff-LLM: End-to-End Lossless Compression for Efficient LLM Inference
di: Yubeaton, Patrick, et al.
Pubblicazione: (2025)

Proximity to Losslessly Compressible Parameters
di: Farrugia-Roberts, Matthew
Pubblicazione: (2023)

Lossless Compression of Vector IDs for Approximate Nearest Neighbor Search
di: Severo, Daniel, et al.
Pubblicazione: (2025)

Random Cycle Coding: Lossless Compression of Cluster Assignments via Bits-Back Coding
di: Severo, Daniel, et al.
Pubblicazione: (2024)

ZipNN: Lossless Compression for AI Models
di: Hershcovitch, Moshik, et al.
Pubblicazione: (2024)

LoMA: Lossless Compressed Memory Attention
di: Wang, Yumeng, et al.
Pubblicazione: (2024)

KeepKV: Achieving Periodic Lossless KV Cache Compression for Efficient LLM Inference
di: Tian, Yuxuan, et al.
Pubblicazione: (2025)

GEAR: An Efficient KV Cache Compression Recipe for Near-Lossless Generative Inference of LLM
di: Kang, Hao, et al.
Pubblicazione: (2024)

SplitZip: Ultra Fast Lossless KV Compression for Disaggregated LLM Serving
di: Guo, Yipin, et al.
Pubblicazione: (2026)

To Compress or Not? Pushing the Frontier of Lossless GenAI Model Weights Compression with Exponent Concentration
di: Yang, Zeyu, et al.
Pubblicazione: (2025)

Communication Compression for Tensor Parallel LLM Inference
di: Hansen-Palmus, Jan, et al.
Pubblicazione: (2024)

Lossless Token Sequence Compression via Meta-Tokens
di: Harvill, John, et al.
Pubblicazione: (2025)

ZipServ: Fast and Memory-Efficient LLM Inference with Hardware-Aware Lossless Compression
di: Fan, Ruibo, et al.
Pubblicazione: (2026)

Lossless Compression: A New Benchmark for Time Series Model Evaluation
di: Wan, Meng, et al.
Pubblicazione: (2025)

Lossless Compression via Chained Lightweight Neural Predictors with Information Inheritance
di: Kim, Yuriy, et al.
Pubblicazione: (2026)

Quad Length Codes for Lossless Compression of e4m3
di: Agrawal, Aditya, et al.
Pubblicazione: (2026)

AlphaZip: Neural Network-Enhanced Lossless Text Compression
di: Narashiman, Swathi Shree, et al.
Pubblicazione: (2024)

Llamazip: Leveraging LLaMA for Lossless Text Compression and Training Dataset Detection
di: Dréano, Sören, et al.
Pubblicazione: (2025)

"Lossless" Compression of Deep Neural Networks: A High-dimensional Neural Tangent Kernel Approach
di: Gu, Lingyu, et al.
Pubblicazione: (2024)

Lossless Model Compression via Joint Low-Rank Factorization Optimization
di: Zhang, Boyang, et al.
Pubblicazione: (2024)

Accelerating LLM Inference with Lossless Speculative Decoding Algorithms for Heterogeneous Vocabularies
di: Timor, Nadav, et al.
Pubblicazione: (2025)

Off Policy Lyapunov Stability in Reinforcement Learning
di: Gill, Sarvan, et al.
Pubblicazione: (2025)

Benchmarking Language Modeling for Lossless Compression of Full-Fidelity Audio
di: Long, Phillip, et al.
Pubblicazione: (2026)

Lossless Compression of Large Language Model-Generated Text via Next-Token Prediction
di: Mao, Yu, et al.
Pubblicazione: (2025)

TurboAngle: Near-Lossless KV Cache Compression via Uniform Angle Quantization
di: Patel, Dipkumar
Pubblicazione: (2026)

TensorLLM: Tensorising Multi-Head Attention for Enhanced Reasoning and Compression in LLMs
di: Gu, Yuxuan, et al.
Pubblicazione: (2025)

70% Size, 100% Accuracy: Lossless LLM Compression for Efficient GPU Inference via Dynamic-Length Float (DFloat11)
di: Zhang, Tianyi, et al.
Pubblicazione: (2025)

LatentLLM: Attention-Aware Joint Tensor Compression
di: Koike-Akino, Toshiaki, et al.
Pubblicazione: (2025)

Lossless Image Compression Using Multi-level Dictionaries: Binary Images
di: Agnihotri, Samar, et al.
Pubblicazione: (2024)

VeriCache: Turning Lossy KV Cache into Lossless LLM Inference
di: Yao, Jiayi, et al.
Pubblicazione: (2026)

Users Favor LLM-Generated Content -- Until They Know It's AI
di: Parshakov, Petr, et al.
Pubblicazione: (2025)

Approximation and interpolation of deep neural networks
di: Constantinescu, Vlad-Raul, et al.
Pubblicazione: (2023)

Learning Lossless Compression for High Bit-Depth Volumetric Medical Image
di: Wang, Kai, et al.
Pubblicazione: (2024)

SamBaTen: Sampling-based Batch Incremental Tensor Decomposition
di: Gujral, Ekta, et al.
Pubblicazione: (2017)

FineZip : Pushing the Limits of Large Language Models for Practical Lossless Text Compression
di: Mittu, Fazal, et al.
Pubblicazione: (2024)

Lossless Point Cloud Geometry and Attribute Compression Using a Learned Conditional Probability Model
di: Nguyen, Dat Thanh, et al.
Pubblicazione: (2023)

Compressing Structured Tensor Algebra
di: Ghorbani, Mahdi, et al.
Pubblicazione: (2024)

Accelerating Distributed Deep Learning using Lossless Homomorphic Compression
di: Li, Haoyu, et al.
Pubblicazione: (2024)

Symbolic Snapshot Ensembles
di: Liu, Mingyue, et al.
Pubblicazione: (2025)