Przejdź do treści
VuFind
  • Login
    • English
    • Deutsch
    • Español
    • Français
    • Italiano
    • 日本語
    • Nederlands
    • Português
    • Português (Brasil)
    • 中文(简体)
    • 中文(繁體)
    • Türkçe
    • עברית
    • Gaeilge
    • Cymraeg
    • Ελληνικά
    • Català
    • Euskara
    • Русский
    • Čeština
    • Suomi
    • Svenska
    • polski
    • Dansk
    • slovenščina
    • اللغة العربية
    • বাংলা
    • Galego
    • Tiếng Việt
    • Hrvatski
    • हिंदी
    • Հայերէն
    • Українська
    • Sámegiella
    • Монгол
    • Māori
Wyszukiwanie zaawansowane
  • Cytować
  • Wyślij wiadomość
  • Wyślij emailem
  • Drukuj
  • Eksportuj rekord
    • Eksportuj do RefWorks
    • Eksportuj do EndNoteWeb
    • Eksportuj do EndNote
  • Dodaj do listy ulubionych książek
  • Odnośnik bezpośredni
Okładka

Zapisane w:
Opis bibliograficzny
1. autor: Gökyıldız, Onur
Format: Recurso digital
Język:angielski
Wydane: Zenodo 2026
Hasła przedmiotowe:
KV cache compression
compound quantization error
Pre-RoPE quantization
KV compaction
TurboQuant
Rust
GGUF
Lloyd-Max codebook
Walsh-Hadamard transform
SIMD
Dostęp online:https://doi.org/10.5281/zenodo.19375408
Etykiety: Dodaj etykietę
Nie ma etykietki, Dołącz pierwszą etykiete!
  • Egzemplarz
  • Opis
  • Spis treści
  • Komentarze
  • Podobne zapisy
  • Wersja MARC

Internet

https://doi.org/10.5281/zenodo.19375408

Podobne zapisy

  • Differentially Private KV-Cache Transmission for Split LLM Inference
    od: Yu, Renjie
    Wydane: (2026)
  • Pre-registered Falsification of Timing-Based Divergence Decomposition in KV-Cache Compression
    od: RIGAUD, Régis
    Wydane: (2026)
  • Companion artefact for "Distributed Serving Architectures for Large Language Model Inference: A Taxonomy, Quantitative Models, and Practitioner's Decision Framework"
    od: Chukkapalli, Divya, i wsp.
    Wydane: (2026)
  • Positive B-splines used as Mappings in the Probabilistic Quantizer
    od: Juan-Pablo Hoyos-Sánchez
    Wydane: (2024)
  • Toward Multi-Trit Quantization for Large Language Models: A Theoretical Framework for Balanced N-Trit Weights, Trit-Plane Generalization, and Mixed-Layer Precision
    od: Heiden, Jeff McGillis
    Wydane: (2026)

Opcje wyszukiwania

  • Historia wyszukiwania
  • Wyszukiwanie zaawansowane

Dalsze opcje

  • Przeglądaj katalog
  • Przeglądaj alfabetycznie
  • Przeglądaj kanały
  • Aparaty semestralne
  • Nowe nabytki

Pomoc

  • Wskazówka do wyszukiwania
  • Zapytaj bibliotekarza
  • Często zadawane pytania