Enregistré dans:
| Auteur principal: | D'Alberto, Paolo |
|---|---|
| Format: | Preprint |
| Publié: |
2026
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2605.08114 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
FibQuant: Universal Vector Quantization for Random-Access KV-Cache Compression
par: Lee, Namyoon, et autres
Publié: (2026)
par: Lee, Namyoon, et autres
Publié: (2026)
RateQuant: Optimal Mixed-Precision KV Cache Quantization via Rate-Distortion Theory
par: Zuo, Fei, et autres
Publié: (2026)
par: Zuo, Fei, et autres
Publié: (2026)
TurboQuant: Online Vector Quantization with Near-optimal Distortion Rate
par: Zandieh, Amir, et autres
Publié: (2025)
par: Zandieh, Amir, et autres
Publié: (2025)
Scorio.jl: A Julia package for ranking stochastic responses
par: Hariri, Mohsen, et autres
Publié: (2026)
par: Hariri, Mohsen, et autres
Publié: (2026)
A Note on TurboQuant and the Earlier DRIVE/EDEN Line of Work
par: Ben-Basat, Ran, et autres
Publié: (2026)
par: Ben-Basat, Ran, et autres
Publié: (2026)
TurboSAT: Gradient-Guided Boolean Satisfiability Accelerated on GPU-CPU Hybrid System
par: Dai, Steve, et autres
Publié: (2025)
par: Dai, Steve, et autres
Publié: (2025)
Revisiting RaBitQ and TurboQuant: A Symmetric Comparison of Methods, Theory, and Experiments
par: Gao, Jianyang, et autres
Publié: (2026)
par: Gao, Jianyang, et autres
Publié: (2026)
Statistical Complexity of Quantum Learning
par: Banchi, Leonardo, et autres
Publié: (2023)
par: Banchi, Leonardo, et autres
Publié: (2023)
Spectral Toolkit of Algorithms for Graphs: Technical Report (2)
par: Macgregor, Peter, et autres
Publié: (2024)
par: Macgregor, Peter, et autres
Publié: (2024)
Bottlenecked Transformers: Periodic KV Cache Consolidation for Generalised Reasoning
par: Oomerjee, Adnan, et autres
Publié: (2025)
par: Oomerjee, Adnan, et autres
Publié: (2025)
Zero-Truncated Poisson Regression for Sparse Multiway Count Data Corrupted by False Zeros
par: López, Oscar, et autres
Publié: (2022)
par: López, Oscar, et autres
Publié: (2022)
SQuat: Subspace-orthogonal KV Cache Quantization
par: Wang, Hao, et autres
Publié: (2025)
par: Wang, Hao, et autres
Publié: (2025)
NUBO: A Transparent Python Package for Bayesian Optimization
par: Diessner, Mike, et autres
Publié: (2023)
par: Diessner, Mike, et autres
Publié: (2023)
scikit-fda: A Python Package for Functional Data Analysis
par: Ramos-Carreño, Carlos, et autres
Publié: (2022)
par: Ramos-Carreño, Carlos, et autres
Publié: (2022)
evomap: A Toolbox for Dynamic Mapping in Python
par: Matthe, Maximilian
Publié: (2025)
par: Matthe, Maximilian
Publié: (2025)
Rethinking KV Cache Eviction via a Unified Information-Theoretic Objective
par: Yang, Jiaming, et autres
Publié: (2026)
par: Yang, Jiaming, et autres
Publié: (2026)
eOptShrinkQ: Near-Lossless KV Cache Compression Through Optimal Spectral Denoising and Quantization
par: Su, Pei-Chun
Publié: (2026)
par: Su, Pei-Chun
Publié: (2026)
Virtual Parameter Sharpening: Dynamic Low-Rank Perturbations for Inference-Time Reasoning Enhancement
par: Kublashvili, Saba
Publié: (2025)
par: Kublashvili, Saba
Publié: (2025)
A Fast and Scalable Pathwise-Solver for Group Lasso and Elastic Net Penalized Regression via Block-Coordinate Descent
par: Yang, James, et autres
Publié: (2024)
par: Yang, James, et autres
Publié: (2024)
Self-Scaled Broyden Family of Quasi-Newton Methods in JAX
par: Bioli, Ivan, et autres
Publié: (2026)
par: Bioli, Ivan, et autres
Publié: (2026)
Differentiable Parameter Optimization for DAEs with State-Dependent Events
par: Matei, Ion, et autres
Publié: (2026)
par: Matei, Ion, et autres
Publié: (2026)
Dimensional Peeking for Low-Variance Gradients in Zeroth-Order Discrete Optimization via Simulation
par: Andelfinger, Philipp, et autres
Publié: (2026)
par: Andelfinger, Philipp, et autres
Publié: (2026)
auto-fpt: Automating Free Probability Theory Calculations for Machine Learning Theory
par: Subramonian, Arjun, et autres
Publié: (2025)
par: Subramonian, Arjun, et autres
Publié: (2025)
MissMecha: An All-in-One Python Package for Studying Missing Data Mechanisms
par: Zhou, Youran, et autres
Publié: (2025)
par: Zhou, Youran, et autres
Publié: (2025)
Jaya R Package -- A Parameter-Free Solution for Advanced Single and Multi-Objective Optimization
par: Bokde, Neeraj Dhanraj
Publié: (2024)
par: Bokde, Neeraj Dhanraj
Publié: (2024)
A method of using RSVD in residual calculation of LowBit GEMM
par: Gu, Hongyaoxing
Publié: (2024)
par: Gu, Hongyaoxing
Publié: (2024)
CausalVerse: Benchmarking Causal Representation Learning with Configurable High-Fidelity Simulations
par: Chen, Guangyi, et autres
Publié: (2025)
par: Chen, Guangyi, et autres
Publié: (2025)
EarlyStopping: Implicit Regularization for Iterative Learning Procedures in Python
par: Ziebell, Eric, et autres
Publié: (2025)
par: Ziebell, Eric, et autres
Publié: (2025)
Sparser, Better, Faster, Stronger: Sparsity Detection for Efficient Automatic Differentiation
par: Hill, Adrian, et autres
Publié: (2025)
par: Hill, Adrian, et autres
Publié: (2025)
Reproducibility, energy efficiency and performance of pseudorandom number generators in machine learning: a comparative study of python, numpy, tensorflow, and pytorch implementations
par: Antunes, Benjamin, et autres
Publié: (2024)
par: Antunes, Benjamin, et autres
Publié: (2024)
Cooper: A Library for Constrained Optimization in Deep Learning
par: Gallego-Posada, Jose, et autres
Publié: (2025)
par: Gallego-Posada, Jose, et autres
Publié: (2025)
NNTile: a machine learning framework capable of training extremely large GPT language models on a single node
par: Mikhalev, Aleksandr, et autres
Publié: (2025)
par: Mikhalev, Aleksandr, et autres
Publié: (2025)
PlasmoData.jl -- A Julia Framework for Modeling and Analyzing Complex Data as Graphs
par: Cole, David L, et autres
Publié: (2024)
par: Cole, David L, et autres
Publié: (2024)
TorchDA: A Python package for performing data assimilation with deep learning forward and transformation functions
par: Cheng, Sibo, et autres
Publié: (2024)
par: Cheng, Sibo, et autres
Publié: (2024)
BlackJAX: Composable Bayesian inference in JAX
par: Cabezas, Alberto, et autres
Publié: (2024)
par: Cabezas, Alberto, et autres
Publié: (2024)
MinGRU-Based Encoder for Turbo Autoencoder Frameworks
par: Fritschek, Rick, et autres
Publié: (2025)
par: Fritschek, Rick, et autres
Publié: (2025)
Rigorous dynamical mean field theory for stochastic gradient descent methods
par: Gerbelot, Cedric, et autres
Publié: (2022)
par: Gerbelot, Cedric, et autres
Publié: (2022)
Adaptation of XAI to Auto-tuning for Numerical Libraries
par: Aoki, Shota, et autres
Publié: (2024)
par: Aoki, Shota, et autres
Publié: (2024)
Polynomial Context-Truncation Sensitivity in Autoregressive Language Models: Sequential Wyner-Ziv Bounds for KV Cache Compression
par: Kim, Munsik
Publié: (2026)
par: Kim, Munsik
Publié: (2026)
Linearized Optimal Transport pyLOT Library: A Toolkit for Machine Learning on Point Clouds
par: Linwu, Jun, et autres
Publié: (2025)
par: Linwu, Jun, et autres
Publié: (2025)
Documents similaires
-
FibQuant: Universal Vector Quantization for Random-Access KV-Cache Compression
par: Lee, Namyoon, et autres
Publié: (2026) -
RateQuant: Optimal Mixed-Precision KV Cache Quantization via Rate-Distortion Theory
par: Zuo, Fei, et autres
Publié: (2026) -
TurboQuant: Online Vector Quantization with Near-optimal Distortion Rate
par: Zandieh, Amir, et autres
Publié: (2025) -
Scorio.jl: A Julia package for ranking stochastic responses
par: Hariri, Mohsen, et autres
Publié: (2026) -
A Note on TurboQuant and the Earlier DRIVE/EDEN Line of Work
par: Ben-Basat, Ran, et autres
Publié: (2026)