Gespeichert in:
| Hauptverfasser: | Wang, Yuxiang, Yan, Xiao, Ma, Chi, Huang, Mincong, Li, Xiaoguang, Yu, Lei, Liu, Chuan, Han, Ruidong, Jiang, He, Yin, Bin, Chen, Shangyu, Jiang, Fei, Li, Xiang, Lin, Wei, Han, Haowei, Du, Bo, Jiang, Jiawei |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2025
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2505.12663 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
RecIS: Sparse to Dense, A Unified Training Framework for Recommendation Models
von: Zong, Hua, et al.
Veröffentlicht: (2025)
von: Zong, Hua, et al.
Veröffentlicht: (2025)
Embedding Samples Dispatching for Recommendation Model Training in Edge Environments
von: Li, Guopeng, et al.
Veröffentlicht: (2025)
von: Li, Guopeng, et al.
Veröffentlicht: (2025)
HexiSeq: Accommodating Long Context Training of LLMs over Heterogeneous Hardware
von: Liang, Yan, et al.
Veröffentlicht: (2026)
von: Liang, Yan, et al.
Veröffentlicht: (2026)
Efficient Pre-Training of LLMs via Topology-Aware Communication Alignment on More Than 9600 GPUs
von: He, Guoliang, et al.
Veröffentlicht: (2025)
von: He, Guoliang, et al.
Veröffentlicht: (2025)
HexAGenT: Efficient Agentic LLM Serving via Workflow- and Heterogeneity-Aware Scheduling
von: Peng, You, et al.
Veröffentlicht: (2026)
von: Peng, You, et al.
Veröffentlicht: (2026)
Accelerating Distributed MoE Training and Inference with Lina
von: Li, Jiamin, et al.
Veröffentlicht: (2022)
von: Li, Jiamin, et al.
Veröffentlicht: (2022)
HexiScale: Facilitating Large Language Model Training over Heterogeneous Hardware
von: Yan, Ran, et al.
Veröffentlicht: (2024)
von: Yan, Ran, et al.
Veröffentlicht: (2024)
Unleashing Efficient Asynchronous RL Post-Training via Staleness-Constrained Rollout Coordination
von: Li, Haoyang, et al.
Veröffentlicht: (2026)
von: Li, Haoyang, et al.
Veröffentlicht: (2026)
PICO: Accelerating All k-Core Paradigms on GPU
von: Zhao, Chen, et al.
Veröffentlicht: (2024)
von: Zhao, Chen, et al.
Veröffentlicht: (2024)
DistTrain: Addressing Model and Data Heterogeneity with Disaggregated Training for Multimodal Large Language Models
von: Zhang, Zili, et al.
Veröffentlicht: (2024)
von: Zhang, Zili, et al.
Veröffentlicht: (2024)
A Flexible Programmable Pipeline Parallelism Framework for Efficient DNN Training
von: Jiang, Lijuan, et al.
Veröffentlicht: (2025)
von: Jiang, Lijuan, et al.
Veröffentlicht: (2025)
BurstEngine: an Efficient Distributed Framework for Training Transformers on Extremely Long Sequences of over 1M Tokens
von: Sun, Ao, et al.
Veröffentlicht: (2025)
von: Sun, Ao, et al.
Veröffentlicht: (2025)
pFedLoRA: Model-Heterogeneous Personalized Federated Learning with LoRA Tuning
von: Yi, Liping, et al.
Veröffentlicht: (2023)
von: Yi, Liping, et al.
Veröffentlicht: (2023)
DCP: Addressing Input Dynamism In Long-Context Training via Dynamic Context Parallelism
von: Jiang, Chenyu, et al.
Veröffentlicht: (2025)
von: Jiang, Chenyu, et al.
Veröffentlicht: (2025)
Lancet: Accelerating Mixture-of-Experts Training via Whole Graph Computation-Communication Overlapping
von: Jiang, Chenyu, et al.
Veröffentlicht: (2024)
von: Jiang, Chenyu, et al.
Veröffentlicht: (2024)
Seq1F1B: Efficient Sequence-Level Pipeline Parallelism for Large Language Model Training
von: Sun, Ao, et al.
Veröffentlicht: (2024)
von: Sun, Ao, et al.
Veröffentlicht: (2024)
Beyond A Single AI Cluster: A Survey of Decentralized LLM Training
von: Dong, Haotian, et al.
Veröffentlicht: (2025)
von: Dong, Haotian, et al.
Veröffentlicht: (2025)
NestPipe: Large-Scale Recommendation Training on 1,500+ Accelerators via Nested Pipelining
von: Jiang, Zhida, et al.
Veröffentlicht: (2026)
von: Jiang, Zhida, et al.
Veröffentlicht: (2026)
Probabilistic Top-k Dominating Query Monitoring over Multiple Uncertain IoT Data Streams in Edge Computing Environments
von: Lai, Chuan-Chi, et al.
Veröffentlicht: (2019)
von: Lai, Chuan-Chi, et al.
Veröffentlicht: (2019)
FuxiShuffle: An Adaptive and Resilient Shuffle Service for Distributed Data Processing on Alibaba Cloud
von: Lin, Yuhao, et al.
Veröffentlicht: (2026)
von: Lin, Yuhao, et al.
Veröffentlicht: (2026)
A Survey on Model-heterogeneous Federated Learning: Problems, Methods, and Prospects
von: Fan, Boyu, et al.
Veröffentlicht: (2023)
von: Fan, Boyu, et al.
Veröffentlicht: (2023)
FedFQ: Federated Learning with Fine-Grained Quantization
von: Li, Haowei, et al.
Veröffentlicht: (2024)
von: Li, Haowei, et al.
Veröffentlicht: (2024)
Hyperion: Low-Latency Ultra-HD Video Analytics via Collaborative Vision Transformer Inference
von: Jiang, Linyi, et al.
Veröffentlicht: (2025)
von: Jiang, Linyi, et al.
Veröffentlicht: (2025)
Research on Model Parallelism and Data Parallelism Optimization Methods in Large Language Model-Based Recommendation Systems
von: Yang, Haowei, et al.
Veröffentlicht: (2025)
von: Yang, Haowei, et al.
Veröffentlicht: (2025)
Federated Model Heterogeneous Matryoshka Representation Learning
von: Yi, Liping, et al.
Veröffentlicht: (2024)
von: Yi, Liping, et al.
Veröffentlicht: (2024)
Re-evaluating the Memory-balanced Pipeline Parallelism: BPipe
von: Huang, Mincong, et al.
Veröffentlicht: (2024)
von: Huang, Mincong, et al.
Veröffentlicht: (2024)
FLAME: A Serving System Optimized for Large-Scale Generative Recommendation with Efficiency
von: Guo, Xianwen, et al.
Veröffentlicht: (2025)
von: Guo, Xianwen, et al.
Veröffentlicht: (2025)
On the Performance and Memory Footprint of Distributed Training: An Empirical Study on Transformers
von: Lu, Zhengxian, et al.
Veröffentlicht: (2024)
von: Lu, Zhengxian, et al.
Veröffentlicht: (2024)
Heta: Distributed Training of Heterogeneous Graph Neural Networks
von: Zhong, Yuchen, et al.
Veröffentlicht: (2024)
von: Zhong, Yuchen, et al.
Veröffentlicht: (2024)
UAT20: Unifying Liquidity Across Rollups
von: Li, Yue, et al.
Veröffentlicht: (2025)
von: Li, Yue, et al.
Veröffentlicht: (2025)
EcoLife: Carbon-Aware Serverless Function Scheduling for Sustainable Computing
von: Jiang, Yankai, et al.
Veröffentlicht: (2024)
von: Jiang, Yankai, et al.
Veröffentlicht: (2024)
Chameleon: Adaptive Fault Tolerance for Distributed Training via Real-time Policy Selection
von: Zhou, Yuhang, et al.
Veröffentlicht: (2025)
von: Zhou, Yuhang, et al.
Veröffentlicht: (2025)
A Survey of Synchronization Technologies for Low-power Backscatter Communication
von: Jiang, Wenyuan, et al.
Veröffentlicht: (2025)
von: Jiang, Wenyuan, et al.
Veröffentlicht: (2025)
Distributed Indexing Schemes for k-Dominant Skyline Analytics on Uncertain Edge-IoT Data
von: Lai, Chuan-Chi, et al.
Veröffentlicht: (2023)
von: Lai, Chuan-Chi, et al.
Veröffentlicht: (2023)
Bandwidth-Aware and Cost-Efficient Pipeline Parallel Scheduling in Geo-Distributed LLM Training
von: Zhang, Han, et al.
Veröffentlicht: (2026)
von: Zhang, Han, et al.
Veröffentlicht: (2026)
Revisiting the Time Cost Model of AllReduce
von: Xiong, Dian, et al.
Veröffentlicht: (2024)
von: Xiong, Dian, et al.
Veröffentlicht: (2024)
Ghidorah: Fast LLM Inference on Edge with Speculative Decoding and Hetero-Core Parallelism
von: Wei, Jinhui, et al.
Veröffentlicht: (2025)
von: Wei, Jinhui, et al.
Veröffentlicht: (2025)
PipeMax: Enhancing Offline LLM Inference on Commodity GPU Servers
von: Zhang, Hongbin, et al.
Veröffentlicht: (2026)
von: Zhang, Hongbin, et al.
Veröffentlicht: (2026)
The Coverage Overlapping Problem of Serving Arbitrary Crowds in 3D Drone Cellular Networks
von: Lai, Chuan-Chi, et al.
Veröffentlicht: (2020)
von: Lai, Chuan-Chi, et al.
Veröffentlicht: (2020)
RcLLM: Accelerating Generative Recommendation via Beyond-Prefix KV Caching
von: Zhao, Zhan, et al.
Veröffentlicht: (2026)
von: Zhao, Zhan, et al.
Veröffentlicht: (2026)
Ähnliche Einträge
-
RecIS: Sparse to Dense, A Unified Training Framework for Recommendation Models
von: Zong, Hua, et al.
Veröffentlicht: (2025) -
Embedding Samples Dispatching for Recommendation Model Training in Edge Environments
von: Li, Guopeng, et al.
Veröffentlicht: (2025) -
HexiSeq: Accommodating Long Context Training of LLMs over Heterogeneous Hardware
von: Liang, Yan, et al.
Veröffentlicht: (2026) -
Efficient Pre-Training of LLMs via Topology-Aware Communication Alignment on More Than 9600 GPUs
von: He, Guoliang, et al.
Veröffentlicht: (2025) -
HexAGenT: Efficient Agentic LLM Serving via Workflow- and Heterogeneity-Aware Scheduling
von: Peng, You, et al.
Veröffentlicht: (2026)