Enregistré dans:
| Auteurs principaux: | Zhang, Boyang, Cheng, Daning, Zhang, Yunquan |
|---|---|
| Format: | Preprint |
| Publié: |
2025
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2511.06786 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
Lossless Model Compression via Joint Low-Rank Factorization Optimization
par: Zhang, Boyang, et autres
Publié: (2024)
par: Zhang, Boyang, et autres
Publié: (2024)
MoE-DisCo:Low Economy Cost Training Mixture-of-Experts Models
par: Ye, Xin, et autres
Publié: (2026)
par: Ye, Xin, et autres
Publié: (2026)
A General Error-Theoretical Analysis Framework for Constructing Compression Strategies
par: Zhang, Boyang, et autres
Publié: (2025)
par: Zhang, Boyang, et autres
Publié: (2025)
MoQE: Improve Quantization Model performance via Mixture of Quantization Experts
par: Zhang, Jinhao, et autres
Publié: (2025)
par: Zhang, Jinhao, et autres
Publié: (2025)
Asynch-SGBDT: Asynchronous Parallel Stochastic Gradient Boosting Decision Tree based on Parameters Server
par: Daning, Cheng, et autres
Publié: (2018)
par: Daning, Cheng, et autres
Publié: (2018)
HeRo-Q: A General Framework for Stable Low Bit Quantization via Hessian Conditioning
par: Zhang, Jinhao Zhang Yunquan, et autres
Publié: (2026)
par: Zhang, Jinhao Zhang Yunquan, et autres
Publié: (2026)
FP=xINT:Representing Neural Networks via Low-Bit Series Basis Functions
par: Zhang, Boyang, et autres
Publié: (2024)
par: Zhang, Boyang, et autres
Publié: (2024)
A Qualitative Test-Risk Mechanism for Scaling Behavior in Normalized Residual Networks
par: Cheng, Daning, et autres
Publié: (2026)
par: Cheng, Daning, et autres
Publié: (2026)
Compression for Better: A General and Stable Lossless Compression Framework
par: Zhang, Boyang, et autres
Publié: (2024)
par: Zhang, Boyang, et autres
Publié: (2024)
Exploiting Block Coordinate Descent for Cost-Effective LLM Model Training
par: Liu, Zeyu, et autres
Publié: (2025)
par: Liu, Zeyu, et autres
Publié: (2025)
CALM: A CKA-Guided Adaptive Layer-Wise Modularization Framework for LLM Quantization
par: Zhang, Jinhao, et autres
Publié: (2025)
par: Zhang, Jinhao, et autres
Publié: (2025)
Can the capability of Large Language Models be described by human ability? A Meta Study
par: Zan, Mingrui, et autres
Publié: (2025)
par: Zan, Mingrui, et autres
Publié: (2025)
Robust Variable Selection for High-dimensional Regression with Missing Data and Measurement Errors
par: Zhang, Zhenhao, et autres
Publié: (2024)
par: Zhang, Zhenhao, et autres
Publié: (2024)
Basis Sharing: Cross-Layer Parameter Sharing for Large Language Model Compression
par: Wang, Jingcun, et autres
Publié: (2024)
par: Wang, Jingcun, et autres
Publié: (2024)
DynaTrain: Fast Online Parallelism Switching for Elastic LLM Training
par: Wang, Yuanqing, et autres
Publié: (2026)
par: Wang, Yuanqing, et autres
Publié: (2026)
Rethinking Structure Learning For Graph Neural Networks
par: Zheng, Yilun, et autres
Publié: (2024)
par: Zheng, Yilun, et autres
Publié: (2024)
Sharing Parameter by Conjugation for Knowledge Graph Embeddings in Complex Space
par: Feng, Xincan, et autres
Publié: (2024)
par: Feng, Xincan, et autres
Publié: (2024)
Rethinking Graph Domain Adaptation: A Spectral Contrastive Perspective
par: Zhang, Haoyu, et autres
Publié: (2025)
par: Zhang, Haoyu, et autres
Publié: (2025)
NN-Former: Rethinking Graph Structure in Neural Architecture Representation
par: Xu, Ruihan, et autres
Publié: (2025)
par: Xu, Ruihan, et autres
Publié: (2025)
Global Description of Flutter Dynamics via Koopman Theory
par: Song, Jiwoo, et autres
Publié: (2025)
par: Song, Jiwoo, et autres
Publié: (2025)
Rethinking Parameter Sharing for LLM Fine-Tuning with Multiple LoRAs
par: Ban, Hao, et autres
Publié: (2025)
par: Ban, Hao, et autres
Publié: (2025)
CommonKV: Compressing KV Cache with Cross-layer Parameter Sharing
par: Wang, Yixuan, et autres
Publié: (2025)
par: Wang, Yixuan, et autres
Publié: (2025)
Learning Coarse-Grained Dynamics on Graph
par: Yu, Yin, et autres
Publié: (2024)
par: Yu, Yin, et autres
Publié: (2024)
StructComp: Substituting Propagation with Structural Compression in Training Graph Contrastive Learning
par: Zhang, Shengzhong, et autres
Publié: (2023)
par: Zhang, Shengzhong, et autres
Publié: (2023)
Rethinking Encoder-Decoder Flow Through Shared Structures
par: Laboyrie, Frederik, et autres
Publié: (2025)
par: Laboyrie, Frederik, et autres
Publié: (2025)
Modal Analysis of Spatiotemporal Data via Multivariate Gaussian Process Regression
par: Song, Jiwoo, et autres
Publié: (2024)
par: Song, Jiwoo, et autres
Publié: (2024)
Parameter-Free Structural-Diversity Message Passing for Graph Neural Networks
par: Kong, Mingyue, et autres
Publié: (2025)
par: Kong, Mingyue, et autres
Publié: (2025)
Learning solution operator of dynamical systems with diffusion maps kernel ridge regression
par: Song, Jiwoo, et autres
Publié: (2025)
par: Song, Jiwoo, et autres
Publié: (2025)
SMEC: Rethinking Matryoshka Representation Learning for Retrieval Embedding Compression
par: Zhang, Biao, et autres
Publié: (2025)
par: Zhang, Biao, et autres
Publié: (2025)
LLM as Graph Kernel: Rethinking Message Passing on Text-Rich Graphs
par: Zhang, Ying, et autres
Publié: (2026)
par: Zhang, Ying, et autres
Publié: (2026)
Rethinking Tokenizer and Decoder in Masked Graph Modeling for Molecules
par: Liu, Zhiyuan, et autres
Publié: (2023)
par: Liu, Zhiyuan, et autres
Publié: (2023)
Optimizing Specific and Shared Parameters for Efficient Parameter Tuning
par: Nguyen, Van-Anh, et autres
Publié: (2025)
par: Nguyen, Van-Anh, et autres
Publié: (2025)
Rethinking Probabilistic Circuit Parameter Learning
par: Liu, Anji, et autres
Publié: (2025)
par: Liu, Anji, et autres
Publié: (2025)
GRASP: Replace Redundant Layers with Adaptive Singular Parameters for Efficient Model Compression
par: Liu, Kainan, et autres
Publié: (2024)
par: Liu, Kainan, et autres
Publié: (2024)
Symbolic Regression for Shared Expressions: Introducing Partial Parameter Sharing
par: Martinek, Viktor, et autres
Publié: (2026)
par: Martinek, Viktor, et autres
Publié: (2026)
Rethinking the Expressive Power of GNNs via Graph Biconnectivity
par: Zhang, Bohang, et autres
Publié: (2023)
par: Zhang, Bohang, et autres
Publié: (2023)
LOCAL: Learning with Orientation Matrix to Infer Causal Structure from Time Series Data
par: Zhang, Jiajun, et autres
Publié: (2024)
par: Zhang, Jiajun, et autres
Publié: (2024)
Structural Invariance Matters: Rethinking Graph Rewiring through Graph Metrics
par: Benoit, Alexandre, et autres
Publié: (2025)
par: Benoit, Alexandre, et autres
Publié: (2025)
Rethinking the Power of Graph Canonization in Graph Representation Learning with Stability
par: Dong, Zehao, et autres
Publié: (2023)
par: Dong, Zehao, et autres
Publié: (2023)
Rethinking Generalization in Graph Neural Networks: A Structural Complexity Perspective
par: Wang, Peiyao, et autres
Publié: (2026)
par: Wang, Peiyao, et autres
Publié: (2026)
Documents similaires
-
Lossless Model Compression via Joint Low-Rank Factorization Optimization
par: Zhang, Boyang, et autres
Publié: (2024) -
MoE-DisCo:Low Economy Cost Training Mixture-of-Experts Models
par: Ye, Xin, et autres
Publié: (2026) -
A General Error-Theoretical Analysis Framework for Constructing Compression Strategies
par: Zhang, Boyang, et autres
Publié: (2025) -
MoQE: Improve Quantization Model performance via Mixture of Quantization Experts
par: Zhang, Jinhao, et autres
Publié: (2025) -
Asynch-SGBDT: Asynchronous Parallel Stochastic Gradient Boosting Decision Tree based on Parameters Server
par: Daning, Cheng, et autres
Publié: (2018)