Enregistré dans:
| Auteurs principaux: | Liu, Wei, Panda, Anweshit, Pandey, Ujwal, Cook, Haven, Slota, George M., Wang, Naigang, Chen, Jie, Xu, Yangyang |
|---|---|
| Format: | Preprint |
| Publié: |
2026
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2604.09970 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
Anonymized Network Sensing using C++26 std::execution on GPUs
par: Mandulak, Michael, et autres
Publié: (2025)
par: Mandulak, Michael, et autres
Publié: (2025)
HeLoCo: Efficient asynchronous low-communication training under data and device heterogeneity
par: Asif, Abdullah Al, et autres
Publié: (2026)
par: Asif, Abdullah Al, et autres
Publié: (2026)
Controlled disagreement improves generalization in decentralized training
par: Wang, Zesen, et autres
Publié: (2026)
par: Wang, Zesen, et autres
Publié: (2026)
From promise to practice: realizing high-performance decentralized training
par: Wang, Zesen, et autres
Publié: (2024)
par: Wang, Zesen, et autres
Publié: (2024)
A unified framework to improve the interoperability between HPC and Big Data languages and programming models
par: Piñeiro, César, et autres
Publié: (2021)
par: Piñeiro, César, et autres
Publié: (2021)
Unlocking Real-Time Fluorescence Lifetime Imaging: Multi-Pixel Parallelism for FPGA-Accelerated Processing
par: Erbas, Ismail, et autres
Publié: (2024)
par: Erbas, Ismail, et autres
Publié: (2024)
Dave: a decentralized, secure, and lively fraud-proof algorithm
par: Nehab, Diego, et autres
Publié: (2024)
par: Nehab, Diego, et autres
Publié: (2024)
Federated Learning framework for LoRaWAN-enabled IIoT communication: A case study
par: Sanchez, Oscar Torres, et autres
Publié: (2024)
par: Sanchez, Oscar Torres, et autres
Publié: (2024)
InfiniLoRA: Disaggregated Multi-LoRA Serving for Large Language Models
par: Chen, Hongyu, et autres
Publié: (2026)
par: Chen, Hongyu, et autres
Publié: (2026)
Semi-decentralized Federated Time Series Prediction with Client Availability Budgets
par: Bao, Yunkai, et autres
Publié: (2025)
par: Bao, Yunkai, et autres
Publié: (2025)
PCCL: Photonic circuit-switched collective communication for distributed ML
par: Kumar, Abhishek Vijaya, et autres
Publié: (2025)
par: Kumar, Abhishek Vijaya, et autres
Publié: (2025)
CD-Raft: Reducing the Latency of Distributed Consensus in Cross-Domain Sites
par: Wang, Yangyang, et autres
Publié: (2026)
par: Wang, Yangyang, et autres
Publié: (2026)
An Efficient Approach for Energy Conservation in Cloud Computing Environment
par: Pande, Sohan Kumar, et autres
Publié: (2025)
par: Pande, Sohan Kumar, et autres
Publié: (2025)
Gathering of asynchronous robots on circle with limited visibility using finite communication
par: Sharma, Avisek, et autres
Publié: (2025)
par: Sharma, Avisek, et autres
Publié: (2025)
Self-adaptive, Requirements-driven Autoscaling of Microservices
par: Nunes, João Paulo Karol Santos, et autres
Publié: (2024)
par: Nunes, João Paulo Karol Santos, et autres
Publié: (2024)
Characterizing Communication Patterns in Distributed Large Language Model Inference
par: Xu, Lang, et autres
Publié: (2025)
par: Xu, Lang, et autres
Publié: (2025)
Decentralized and Self-adaptive Core Maintenance on Temporal Graphs
par: Rucci, Davide, et autres
Publié: (2025)
par: Rucci, Davide, et autres
Publié: (2025)
A Decentralized Microservice Scheduling Approach Using Service Mesh in Cloud-Edge Systems
par: Wen, Yangyang, et autres
Publié: (2025)
par: Wen, Yangyang, et autres
Publié: (2025)
Predictive-LoRA: A Proactive and Fragmentation-Aware Serverless Inference System for LLMs
par: Ni, Yinan, et autres
Publié: (2025)
par: Ni, Yinan, et autres
Publié: (2025)
EcoLoRA: Communication-Efficient Federated Fine-Tuning of Large Language Models
par: Liu, Han, et autres
Publié: (2025)
par: Liu, Han, et autres
Publié: (2025)
LoRA-C: Parameter-Efficient Fine-Tuning of Robust CNN for IoT Devices
par: Ding, Chuntao, et autres
Publié: (2024)
par: Ding, Chuntao, et autres
Publié: (2024)
Application-level observability for adaptive Edge to Cloud continuum systems
par: Sidi, Kaddour, et autres
Publié: (2026)
par: Sidi, Kaddour, et autres
Publié: (2026)
Fog enabled distributed training architecture for federated learning
par: Kumar, Aditya, et autres
Publié: (2024)
par: Kumar, Aditya, et autres
Publié: (2024)
Tasking framework for Adaptive Speculative Parallel Mesh Generation
par: Tsolakis, Christos, et autres
Publié: (2024)
par: Tsolakis, Christos, et autres
Publié: (2024)
A common parallel framework for LLP combinatorial problems
par: Alves, David Ribeiro, et autres
Publié: (2026)
par: Alves, David Ribeiro, et autres
Publié: (2026)
Scrutiny new framework in integrated distributed reliable systems
par: Gashti, Mehdi Zekriyapanah
Publié: (2025)
par: Gashti, Mehdi Zekriyapanah
Publié: (2025)
Revisiting Speculative Leaderless Protocols for Low-Latency BFT Replication
par: Qian, Daniel, et autres
Publié: (2026)
par: Qian, Daniel, et autres
Publié: (2026)
CaraServe: CPU-Assisted and Rank-Aware LoRA Serving for Generative LLM Inference
par: Li, Suyi, et autres
Publié: (2024)
par: Li, Suyi, et autres
Publié: (2024)
Simulating LLM training workloads for heterogeneous compute and network infrastructure
par: Kumar, Sumit, et autres
Publié: (2025)
par: Kumar, Sumit, et autres
Publié: (2025)
emucxl: an emulation framework for CXL-based disaggregated memory applications
par: Gond, Raja, et autres
Publié: (2024)
par: Gond, Raja, et autres
Publié: (2024)
FedQuad: Adaptive Layer-wise LoRA Deployment and Activation Quantization for Federated Fine-Tuning
par: Li, Rukuo, et autres
Publié: (2025)
par: Li, Rukuo, et autres
Publié: (2025)
FDLoRA: Personalized Federated Learning of Large Language Model via Dual LoRA Tuning
par: QI, Jiaxing, et autres
Publié: (2024)
par: QI, Jiaxing, et autres
Publié: (2024)
LRScheduler: A Layer-aware and Resource-adaptive Container Scheduler in Edge Computing
par: Tang, Zhiqing, et autres
Publié: (2025)
par: Tang, Zhiqing, et autres
Publié: (2025)
Nezha: A Key-Value Separated Distributed Store with Optimized Raft Integration
par: Wang, Yangyang, et autres
Publié: (2026)
par: Wang, Yangyang, et autres
Publié: (2026)
COPUS: Co-adaptive Parallelism and Batch Size Selection in Large Language Model Training
par: Sakip, Akhmed, et autres
Publié: (2026)
par: Sakip, Akhmed, et autres
Publié: (2026)
LoHan: Low-Cost High-Performance Framework to Fine-Tune 100B Model on a Consumer GPU
par: Liao, Changyue, et autres
Publié: (2024)
par: Liao, Changyue, et autres
Publié: (2024)
Decentralized Federated Averaging via Random Walk
par: Wang, Changheng, et autres
Publié: (2025)
par: Wang, Changheng, et autres
Publié: (2025)
GeoNimbus: A serverless framework to build earth observation and environmental services
par: Sánchez-Gallegos, Dante D., et autres
Publié: (2025)
par: Sánchez-Gallegos, Dante D., et autres
Publié: (2025)
FIRED: a fine-grained robust performance diagnosis framework for cloud applications
par: Xin, Ruyue, et autres
Publié: (2022)
par: Xin, Ruyue, et autres
Publié: (2022)
Flotilla: A scalable, modular and resilient federated learning framework for heterogeneous resources
par: Banerjee, Roopkatha, et autres
Publié: (2025)
par: Banerjee, Roopkatha, et autres
Publié: (2025)
Documents similaires
-
Anonymized Network Sensing using C++26 std::execution on GPUs
par: Mandulak, Michael, et autres
Publié: (2025) -
HeLoCo: Efficient asynchronous low-communication training under data and device heterogeneity
par: Asif, Abdullah Al, et autres
Publié: (2026) -
Controlled disagreement improves generalization in decentralized training
par: Wang, Zesen, et autres
Publié: (2026) -
From promise to practice: realizing high-performance decentralized training
par: Wang, Zesen, et autres
Publié: (2024) -
A unified framework to improve the interoperability between HPC and Big Data languages and programming models
par: Piñeiro, César, et autres
Publié: (2021)