Skip to content
VuFind
  • Login
    • English
    • Deutsch
    • Español
    • Français
    • Italiano
    • 日本語
    • Nederlands
    • Português
    • Português (Brasil)
    • 中文(简体)
    • 中文(繁體)
    • Türkçe
    • עברית
    • Gaeilge
    • Cymraeg
    • Ελληνικά
    • Català
    • Euskara
    • Русский
    • Čeština
    • Suomi
    • Svenska
    • polski
    • Dansk
    • slovenščina
    • اللغة العربية
    • বাংলা
    • Galego
    • Tiếng Việt
    • Hrvatski
    • हिंदी
    • Հայերէն
    • Українська
    • Sámegiella
    • Монгол
    • Māori
Udvidet
  • Citér dette
  • Stav dette
  • Email dette
  • Udskriv
  • Eksportér post
    • Eksportér til RefWorks
    • Eksportér til EndNoteWeb
    • Eksportér til EndNote
  • Føj til favoritter
  • Permanent link
Omslagsbillede

Saved in:
Bibliografiske detaljer
Main Authors: Yu, Yanpeng, Ma, Haiyue, Agarwal, Krish, Oswald, Nicolai, Huang, Qijing, Linsenmaier, Hugo, Mei, Chunhui, Zhao, Ritchie, Borkar, Ritika, Rouhani, Bita Darvish, Nellans, David, Krashinsky, Ronny, Khandelwal, Anurag
Format: Preprint
Udgivet: 2025
Fag:
Distributed, Parallel, and Cluster Computing
Hardware Architecture
Online adgang:https://arxiv.org/abs/2512.09277
Tags: Tilføj Tag
Ingen Tags, Vær først til at tagge denne postø!
  • Beholdninger
  • Beskrivelse
  • Indholdsfortegnelse
  • Kommentar
  • Lignende værker
  • Medarbejdervisning

Internet

https://arxiv.org/abs/2512.09277

Lignende værker

  • Helix Parallelism: Rethinking Sharding Strategies for Interactive Multi-Million-Token LLM Decoding
    af: Bhatia, Nidhi, et al.
    Udgivet: (2025)
  • Reducing the Cost of Dropout in Flash-Attention by Hiding RNG with GEMM
    af: Ma, Haiyue, et al.
    Udgivet: (2024)
  • Key, Value, Compress: A Systematic Exploration of KV Cache Compression Techniques
    af: Javidnia, Neusha, et al.
    Udgivet: (2025)
  • Beyond the Buzz: A Pragmatic Take on Inference Disaggregation
    af: Mitra, Tiyasa, et al.
    Udgivet: (2025)
  • ResMoE: Space-efficient Compression of Mixture of Experts LLMs via Residual Restoration
    af: Ai, Mengting, et al.
    Udgivet: (2025)

Søgemuligheder

  • Søg Historie
  • Udvidet søgning

Find flere

  • Gennemse kataloget
  • Gennemse alfabetisk
  • Explore Channels
  • Kursusreservationer
  • Nye værker

Har du brug for hjælp?

  • Søgetips
  • Spørg en bibliotekar
  • FAQ’er