Gespeichert in:
| Hauptverfasser: | Xiong, Tao, Wang, Yong |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2024
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2405.08411 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
Driving Computational Efficiency in Large-Scale Platforms using HPC Technologies
von: Mendez, Alexander Martinez, et al.
Veröffentlicht: (2026)
von: Mendez, Alexander Martinez, et al.
Veröffentlicht: (2026)
Online Optimization of DNN Inference Network Utility in Collaborative Edge Computing
von: Li, Rui, et al.
Veröffentlicht: (2024)
von: Li, Rui, et al.
Veröffentlicht: (2024)
Steering a Fleet: Adaptation for Large-Scale, Workflow-Based Experiments
von: Pruyne, Jim, et al.
Veröffentlicht: (2024)
von: Pruyne, Jim, et al.
Veröffentlicht: (2024)
ReviveMoE: Fast Recovery for Hardware Failures in Large-Scale MoE LLM Inference Deployments
von: Li, Haley, et al.
Veröffentlicht: (2026)
von: Li, Haley, et al.
Veröffentlicht: (2026)
ExpertWeave: Efficiently Serving Expert-Specialized Fine-Tuned Adapters at Scale
von: Shi, Ge, et al.
Veröffentlicht: (2025)
von: Shi, Ge, et al.
Veröffentlicht: (2025)
GreenWhisk: Emission-Aware Computing for Serverless Platform
von: Serenari, Jayden, et al.
Veröffentlicht: (2024)
von: Serenari, Jayden, et al.
Veröffentlicht: (2024)
MPI-Q: A Message Communication Library for Large-Scale Classical-Quantum Heterogeneous Hybrid Distributed Computing
von: Wang, Feng, et al.
Veröffentlicht: (2026)
von: Wang, Feng, et al.
Veröffentlicht: (2026)
A Unified Programming Model for Heterogeneous Computing with CPU and Accelerator Technologies
von: Xiong, Yuqing
Veröffentlicht: (2022)
von: Xiong, Yuqing
Veröffentlicht: (2022)
FLAME: A Serving System Optimized for Large-Scale Generative Recommendation with Efficiency
von: Guo, Xianwen, et al.
Veröffentlicht: (2025)
von: Guo, Xianwen, et al.
Veröffentlicht: (2025)
A Distributed Approach for Persistent Homology Computation on a Large Scale
von: Ceccaroni, Riccardo, et al.
Veröffentlicht: (2024)
von: Ceccaroni, Riccardo, et al.
Veröffentlicht: (2024)
Comparing Cross-Platform Performance via Node-to-Node Scaling Studies
von: Weiss, Kenneth, et al.
Veröffentlicht: (2025)
von: Weiss, Kenneth, et al.
Veröffentlicht: (2025)
SimDC: A High-Fidelity Device Simulation Platform for Device-Cloud Collaborative Computing
von: Pei, Ruiguang, et al.
Veröffentlicht: (2025)
von: Pei, Ruiguang, et al.
Veröffentlicht: (2025)
Declarative Data Pipeline for Large Scale ML Services
von: Yang, Yunzhao, et al.
Veröffentlicht: (2025)
von: Yang, Yunzhao, et al.
Veröffentlicht: (2025)
A Virtual Laboratory for Managing Computational Experiments
von: Adamidi, Eleni, et al.
Veröffentlicht: (2025)
von: Adamidi, Eleni, et al.
Veröffentlicht: (2025)
λScale: Enabling Fast Scaling for Serverless Large Language Model Inference
von: Yu, Minchen, et al.
Veröffentlicht: (2025)
von: Yu, Minchen, et al.
Veröffentlicht: (2025)
Mapping Large Memory-constrained Workflows onto Heterogeneous Platforms
von: Kulagina, Svetlana, et al.
Veröffentlicht: (2024)
von: Kulagina, Svetlana, et al.
Veröffentlicht: (2024)
ColonyOS -- A Meta-Operating System for Distributed Computing Across Heterogeneous Platform
von: Kristiansson, Johan
Veröffentlicht: (2024)
von: Kristiansson, Johan
Veröffentlicht: (2024)
Collaborative Evolution of Intelligent Agents in Large-Scale Microservice Systems
von: Li, Yilin, et al.
Veröffentlicht: (2025)
von: Li, Yilin, et al.
Veröffentlicht: (2025)
Exploring Uncore Frequency Scaling for Heterogeneous Computing
von: Zheng, Zhong, et al.
Veröffentlicht: (2025)
von: Zheng, Zhong, et al.
Veröffentlicht: (2025)
ElasticMoE: An Efficient Auto Scaling Method for Mixture-of-Experts Models
von: Singh, Gursimran, et al.
Veröffentlicht: (2025)
von: Singh, Gursimran, et al.
Veröffentlicht: (2025)
EvoSort: A Genetic-Algorithm-Based Adaptive Parallel Sorting Framework for Large-Scale High Performance Computing
von: Raj, Shashank, et al.
Veröffentlicht: (2025)
von: Raj, Shashank, et al.
Veröffentlicht: (2025)
CGSim: A Simulation Framework for Large Scale Distributed Computing Environment
von: Vatsavai, Sairam Sri, et al.
Veröffentlicht: (2025)
von: Vatsavai, Sairam Sri, et al.
Veröffentlicht: (2025)
DeepServe: Serverless Large Language Model Serving at Scale
von: Hu, Junhao, et al.
Veröffentlicht: (2025)
von: Hu, Junhao, et al.
Veröffentlicht: (2025)
Applying Large-Scale Distributed Computing to Structural Bioinformatics -- Bridging Legacy HPC Clusters With Big Data Technologies Using kafka-slurm-agent
von: Rubach, Pawel
Veröffentlicht: (2025)
von: Rubach, Pawel
Veröffentlicht: (2025)
Model Input Verification of Large Scale Simulations
von: Neykova, Rumyana, et al.
Veröffentlicht: (2024)
von: Neykova, Rumyana, et al.
Veröffentlicht: (2024)
Blockchain Epidemic Consensus for Large-Scale Networks
von: Abdi, Siamak, et al.
Veröffentlicht: (2025)
von: Abdi, Siamak, et al.
Veröffentlicht: (2025)
Tackling the Data-Parallel Load Balancing Bottleneck in LLM Serving: Practical Online Routing at Scale
von: Bu, Tianci, et al.
Veröffentlicht: (2026)
von: Bu, Tianci, et al.
Veröffentlicht: (2026)
Mao: Machine learning approach for NUMA optimization in Warehouse Scale Computers
von: Liu, Yueji, et al.
Veröffentlicht: (2024)
von: Liu, Yueji, et al.
Veröffentlicht: (2024)
Scale: Deep Reinforcement Learning for Container Scheduling in Serverless Edge Computing
von: Chen, Chen, et al.
Veröffentlicht: (2026)
von: Chen, Chen, et al.
Veröffentlicht: (2026)
The HEAL Data Platform
von: Larrick, Brienna M., et al.
Veröffentlicht: (2025)
von: Larrick, Brienna M., et al.
Veröffentlicht: (2025)
eBeeMetrics: An eBPF-based Library Framework for Feedback-free Observability of QoS Metrics
von: Ibnath, Muntaka, et al.
Veröffentlicht: (2026)
von: Ibnath, Muntaka, et al.
Veröffentlicht: (2026)
Metric Criticality Identification for Cloud Microservices
von: Singal, Akanksha, et al.
Veröffentlicht: (2025)
von: Singal, Akanksha, et al.
Veröffentlicht: (2025)
SDSL-Solver: Scalable Distributed Sparse Linear Solvers for Large-Scale Interior Point Methods
von: Yang, Shaofeng, et al.
Veröffentlicht: (2026)
von: Yang, Shaofeng, et al.
Veröffentlicht: (2026)
Resource Management Schemes for Cloud-Native Platforms with Computing Containers of Docker and Kubernetes
von: Mao, Ying, et al.
Veröffentlicht: (2020)
von: Mao, Ying, et al.
Veröffentlicht: (2020)
Efficient Parallel Compilation and Profiling of Quantum Circuits at Large Scales
von: Moore, Jane, et al.
Veröffentlicht: (2026)
von: Moore, Jane, et al.
Veröffentlicht: (2026)
CIR: Lightweight Container Image for Cross-Platform Deployment
von: Li, Fengzhi, et al.
Veröffentlicht: (2026)
von: Li, Fengzhi, et al.
Veröffentlicht: (2026)
Distributed Generative Inference of LLM at Internet Scales with Multi-Dimensional Communication Optimization
von: Chen, Jiu, et al.
Veröffentlicht: (2026)
von: Chen, Jiu, et al.
Veröffentlicht: (2026)
Seer: Proactive Revenue-Aware Scheduling for Live Streaming Services in Crowdsourced Cloud-Edge Platforms
von: Huang, Shaoyuan, et al.
Veröffentlicht: (2024)
von: Huang, Shaoyuan, et al.
Veröffentlicht: (2024)
Benchmarking the Performance of Large Language Models on the Cerebras Wafer Scale Engine
von: Zhang, Zuoning, et al.
Veröffentlicht: (2024)
von: Zhang, Zuoning, et al.
Veröffentlicht: (2024)
HGraphScale: Hierarchical Graph Learning for Autoscaling Microservice Applications in Container-based Cloud Computing
von: Fang, Zhengxin, et al.
Veröffentlicht: (2025)
von: Fang, Zhengxin, et al.
Veröffentlicht: (2025)
Ähnliche Einträge
-
Driving Computational Efficiency in Large-Scale Platforms using HPC Technologies
von: Mendez, Alexander Martinez, et al.
Veröffentlicht: (2026) -
Online Optimization of DNN Inference Network Utility in Collaborative Edge Computing
von: Li, Rui, et al.
Veröffentlicht: (2024) -
Steering a Fleet: Adaptation for Large-Scale, Workflow-Based Experiments
von: Pruyne, Jim, et al.
Veröffentlicht: (2024) -
ReviveMoE: Fast Recovery for Hardware Failures in Large-Scale MoE LLM Inference Deployments
von: Li, Haley, et al.
Veröffentlicht: (2026) -
ExpertWeave: Efficiently Serving Expert-Specialized Fine-Tuned Adapters at Scale
von: Shi, Ge, et al.
Veröffentlicht: (2025)