Salvato in:
| Autori principali: | Chen, Xuanyu, Yang, Nan, Wang, Shuai, Yuan, Dong |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2025
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2511.12188 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
Scaling Law for Language Models Training Considering Batch Size
di: Shuai, Xian, et al.
Pubblicazione: (2024)
di: Shuai, Xian, et al.
Pubblicazione: (2024)
Optimal Look-back Horizon for Time Series Forecasting in Federated Learning
di: Tang, Dahao, et al.
Pubblicazione: (2025)
di: Tang, Dahao, et al.
Pubblicazione: (2025)
Optimal Batch-Size Control for Low-Latency Federated Learning with Device Heterogeneity
di: Yang, Huiling, et al.
Pubblicazione: (2025)
di: Yang, Huiling, et al.
Pubblicazione: (2025)
Scaling Laws of Machine Learning for Optimal Power Flow
di: Liu, Xinyi, et al.
Pubblicazione: (2026)
di: Liu, Xinyi, et al.
Pubblicazione: (2026)
Surge Phenomenon in Optimal Learning Rate and Batch Size Scaling
di: Li, Shuaipeng, et al.
Pubblicazione: (2024)
di: Li, Shuaipeng, et al.
Pubblicazione: (2024)
Fast Catch-Up, Late Switching: Optimal Batch Size Scheduling via Functional Scaling Laws
di: Wang, Jinbo, et al.
Pubblicazione: (2026)
di: Wang, Jinbo, et al.
Pubblicazione: (2026)
Optimal Analysis for Bandit Learning in Matching Markets with Serial Dictatorship
di: Wang, Zilong, et al.
Pubblicazione: (2025)
di: Wang, Zilong, et al.
Pubblicazione: (2025)
Decentralized Federated Learning With Energy Harvesting Devices
di: Zhang, Kai, et al.
Pubblicazione: (2026)
di: Zhang, Kai, et al.
Pubblicazione: (2026)
EMO: Edge Model Overlays to Scale Model Size in Federated Learning
di: Wu, Di, et al.
Pubblicazione: (2025)
di: Wu, Di, et al.
Pubblicazione: (2025)
Federated Learning With Energy Harvesting Devices: An MDP Framework
di: Zhang, Kai, et al.
Pubblicazione: (2024)
di: Zhang, Kai, et al.
Pubblicazione: (2024)
Scaling Laws for Optimal Data Mixtures
di: Shukor, Mustafa, et al.
Pubblicazione: (2025)
di: Shukor, Mustafa, et al.
Pubblicazione: (2025)
Optimal Learning-Rate Schedules under Functional Scaling Laws: Power Decay and Warmup-Stable-Decay
di: Li, Binghui, et al.
Pubblicazione: (2026)
di: Li, Binghui, et al.
Pubblicazione: (2026)
Causal Multi-Label Feature Selection in Federated Setting
di: Song, Yukun, et al.
Pubblicazione: (2024)
di: Song, Yukun, et al.
Pubblicazione: (2024)
Learning Critically: Selective Self Distillation in Federated Learning on Non-IID Data
di: He, Yuting, et al.
Pubblicazione: (2025)
di: He, Yuting, et al.
Pubblicazione: (2025)
Unveiling Scaling Behaviors in Molecular Language Models: Effects of Model Size, Data, and Representation
di: Xu, Dong, et al.
Pubblicazione: (2026)
di: Xu, Dong, et al.
Pubblicazione: (2026)
FedGreen: Carbon-aware Federated Learning with Model Size Adaptation
di: Abbasi, Ali, et al.
Pubblicazione: (2024)
di: Abbasi, Ali, et al.
Pubblicazione: (2024)
Parallel Scaling Law for Language Models
di: Chen, Mouxiang, et al.
Pubblicazione: (2025)
di: Chen, Mouxiang, et al.
Pubblicazione: (2025)
Communication-Efficient Multimodal Federated Learning: Joint Modality and Client Selection
di: Yuan, Liangqi, et al.
Pubblicazione: (2024)
di: Yuan, Liangqi, et al.
Pubblicazione: (2024)
Beyond Chinchilla-Optimal: Accounting for Inference in Language Model Scaling Laws
di: Sardana, Nikhil, et al.
Pubblicazione: (2023)
di: Sardana, Nikhil, et al.
Pubblicazione: (2023)
Optimal Routing for Federated Learning over Dynamic Satellite Networks: Tractable or Not?
di: Zhao, Yi, et al.
Pubblicazione: (2026)
di: Zhao, Yi, et al.
Pubblicazione: (2026)
Theory of Optimal Learning Rate Schedules and Scaling Laws for a Random Feature Model
di: Bordelon, Blake, et al.
Pubblicazione: (2026)
di: Bordelon, Blake, et al.
Pubblicazione: (2026)
Towards Scaling Law Analysis For Spatiotemporal Weather Data
di: Kiefer, Alexander, et al.
Pubblicazione: (2026)
di: Kiefer, Alexander, et al.
Pubblicazione: (2026)
Selecting Large Language Model to Fine-tune via Rectified Scaling Law
di: Lin, Haowei, et al.
Pubblicazione: (2024)
di: Lin, Haowei, et al.
Pubblicazione: (2024)
GuardFed: A Trustworthy Federated Learning Framework Against Dual-Facet Attacks
di: Li, Yanli, et al.
Pubblicazione: (2025)
di: Li, Yanli, et al.
Pubblicazione: (2025)
How Feature Learning Can Improve Neural Scaling Laws
di: Bordelon, Blake, et al.
Pubblicazione: (2024)
di: Bordelon, Blake, et al.
Pubblicazione: (2024)
Holistic Scaling Laws for Optimal Mixture-of-Experts Architecture Optimization
di: Wan, Weilin, et al.
Pubblicazione: (2026)
di: Wan, Weilin, et al.
Pubblicazione: (2026)
Navigating Scaling Laws: Compute Optimality in Adaptive Model Training
di: Anagnostidis, Sotiris, et al.
Pubblicazione: (2023)
di: Anagnostidis, Sotiris, et al.
Pubblicazione: (2023)
Predictable Scale: Part I, Step Law -- Optimal Hyperparameter Scaling Law in Large Language Model Pretraining
di: Li, Houyi, et al.
Pubblicazione: (2025)
di: Li, Houyi, et al.
Pubblicazione: (2025)
FedAPM: Federated Learning via ADMM with Partial Model Personalization
di: Zhu, Shengkun, et al.
Pubblicazione: (2025)
di: Zhu, Shengkun, et al.
Pubblicazione: (2025)
Federated Learning with Enhanced Privacy via Model Splitting and Random Client Participation
di: Li, Yiwei, et al.
Pubblicazione: (2025)
di: Li, Yiwei, et al.
Pubblicazione: (2025)
How Should LLMs Consume High-Quality Data? Optimal Data Scheduling via Quality-Aware Functional Scaling Laws
di: Zhu, Zhitao, et al.
Pubblicazione: (2026)
di: Zhu, Zhitao, et al.
Pubblicazione: (2026)
Adaptive Data Optimization: Dynamic Sample Selection with Scaling Laws
di: Jiang, Yiding, et al.
Pubblicazione: (2024)
di: Jiang, Yiding, et al.
Pubblicazione: (2024)
Transformer Learns Optimal Variable Selection in Group-Sparse Classification
di: Zhang, Chenyang, et al.
Pubblicazione: (2025)
di: Zhang, Chenyang, et al.
Pubblicazione: (2025)
MaskTab: Scalable Masked Tabular Pretraining with Scaling Laws and Distillation for Industrial Classification
di: Zheng, Bo, et al.
Pubblicazione: (2026)
di: Zheng, Bo, et al.
Pubblicazione: (2026)
SubFLOT: Submodel Extraction for Efficient and Personalized Federated Learning via Optimal Transport
di: Jiang, Zheng, et al.
Pubblicazione: (2026)
di: Jiang, Zheng, et al.
Pubblicazione: (2026)
Better and Worse with Scale: How Contextual Entrainment Diverges with Model Size
di: Kukreja, Dikshant, et al.
Pubblicazione: (2026)
di: Kukreja, Dikshant, et al.
Pubblicazione: (2026)
Scaling Laws and Compute-Optimal Training Beyond Fixed Training Durations
di: Hägele, Alexander, et al.
Pubblicazione: (2024)
di: Hägele, Alexander, et al.
Pubblicazione: (2024)
Scaling Laws Across Model Architectures: A Comparative Analysis of Dense and MoE Models in Large Language Models
di: Wang, Siqi, et al.
Pubblicazione: (2024)
di: Wang, Siqi, et al.
Pubblicazione: (2024)
Scaling Laws for Uncertainty in Deep Learning
di: Rosso, Mattia, et al.
Pubblicazione: (2025)
di: Rosso, Mattia, et al.
Pubblicazione: (2025)
Scaling Law with Learning Rate Annealing
di: Tissue, Howe, et al.
Pubblicazione: (2024)
di: Tissue, Howe, et al.
Pubblicazione: (2024)
Documenti analoghi
-
Scaling Law for Language Models Training Considering Batch Size
di: Shuai, Xian, et al.
Pubblicazione: (2024) -
Optimal Look-back Horizon for Time Series Forecasting in Federated Learning
di: Tang, Dahao, et al.
Pubblicazione: (2025) -
Optimal Batch-Size Control for Low-Latency Federated Learning with Device Heterogeneity
di: Yang, Huiling, et al.
Pubblicazione: (2025) -
Scaling Laws of Machine Learning for Optimal Power Flow
di: Liu, Xinyi, et al.
Pubblicazione: (2026) -
Surge Phenomenon in Optimal Learning Rate and Batch Size Scaling
di: Li, Shuaipeng, et al.
Pubblicazione: (2024)