Enregistré dans:
| Auteur principal: | Wu, Haihang |
|---|---|
| Format: | Preprint |
| Publié: |
2024
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2412.06419 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
Adaptive Pruning for Large Language Models with Structural Importance Awareness
par: Zheng, Haotian, et autres
Publié: (2024)
par: Zheng, Haotian, et autres
Publié: (2024)
Entropy-Based Block Pruning for Efficient Large Language Models
par: Yang, Liangwei, et autres
Publié: (2025)
par: Yang, Liangwei, et autres
Publié: (2025)
Toward Adaptive Large Language Models Structured Pruning via Hybrid-grained Weight Importance Assessment
par: Liu, Jun, et autres
Publié: (2024)
par: Liu, Jun, et autres
Publié: (2024)
Adaptive Layer Selection for Layer-Wise Token Pruning in LLM Inference
par: Taniguchi, Rei, et autres
Publié: (2026)
par: Taniguchi, Rei, et autres
Publié: (2026)
Pruning Large Language Models with Semi-Structural Adaptive Sparse Training
par: Huang, Weiyu, et autres
Publié: (2024)
par: Huang, Weiyu, et autres
Publié: (2024)
Channel-Wise Mixed-Precision Quantization for Large Language Models
par: Chen, Zihan, et autres
Publié: (2024)
par: Chen, Zihan, et autres
Publié: (2024)
Sample-aware Adaptive Structured Pruning for Large Language Models
par: Kong, Jun, et autres
Publié: (2025)
par: Kong, Jun, et autres
Publié: (2025)
Large Language Model Pruning
par: Huang, Hanjuan, et autres
Publié: (2024)
par: Huang, Hanjuan, et autres
Publié: (2024)
Large Language Model Meets Constraint Propagation
par: Bonlarron, Alexandre, et autres
Publié: (2025)
par: Bonlarron, Alexandre, et autres
Publié: (2025)
Athena: Efficient Block-Wise Post-Training Quantization for Large Language Models Using Second-Order Matrix Derivative Information
par: Wang, Yanshu, et autres
Publié: (2024)
par: Wang, Yanshu, et autres
Publié: (2024)
EBFT: Effective and Block-Wise Fine-Tuning for Sparse LLMs
par: Guo, Song, et autres
Publié: (2024)
par: Guo, Song, et autres
Publié: (2024)
DLP: Dynamic Layerwise Pruning in Large Language Models
par: Chen, Yuli, et autres
Publié: (2025)
par: Chen, Yuli, et autres
Publié: (2025)
Prompt-based Depth Pruning of Large Language Models
par: Wee, Juyun, et autres
Publié: (2025)
par: Wee, Juyun, et autres
Publié: (2025)
DPPA: Pruning Method for Large Language Model to Model Merging
par: Zhu, Yaochen, et autres
Publié: (2024)
par: Zhu, Yaochen, et autres
Publié: (2024)
Pruning General Large Language Models into Customized Expert Models
par: Zhao, Yirao, et autres
Publié: (2025)
par: Zhao, Yirao, et autres
Publié: (2025)
PrunePath: Towards Highly Structured Sparse Language Models
par: Gu, Zhexuan, et autres
Publié: (2026)
par: Gu, Zhexuan, et autres
Publié: (2026)
From Local to Global: Revisiting Structured Pruning Paradigms for Large Language Models
par: Wang, Ziyan, et autres
Publié: (2025)
par: Wang, Ziyan, et autres
Publié: (2025)
Investigating Hallucinations in Pruned Large Language Models for Abstractive Summarization
par: Chrysostomou, George, et autres
Publié: (2023)
par: Chrysostomou, George, et autres
Publié: (2023)
Saliency-driven Dynamic Token Pruning for Large Language Models
par: Tao, Yao, et autres
Publié: (2025)
par: Tao, Yao, et autres
Publié: (2025)
LLM-Barber: Block-Aware Rebuilder for Sparsity Mask in One-Shot for Large Language Models
par: Su, Yupeng, et autres
Publié: (2024)
par: Su, Yupeng, et autres
Publié: (2024)
ECoFLaP: Efficient Coarse-to-Fine Layer-Wise Pruning for Vision-Language Models
par: Sung, Yi-Lin, et autres
Publié: (2023)
par: Sung, Yi-Lin, et autres
Publié: (2023)
Khayyam Challenge (PersianMMLU): Is Your LLM Truly Wise to The Persian Language?
par: Ghahroodi, Omid, et autres
Publié: (2024)
par: Ghahroodi, Omid, et autres
Publié: (2024)
Importance Weighting Can Help Large Language Models Self-Improve
par: Jiang, Chunyang, et autres
Publié: (2024)
par: Jiang, Chunyang, et autres
Publié: (2024)
LaCo: Large Language Model Pruning via Layer Collapse
par: Yang, Yifei, et autres
Publié: (2024)
par: Yang, Yifei, et autres
Publié: (2024)
Revisiting Large Language Model Pruning using Neuron Semantic Attribution
par: Ding, Yizhuo, et autres
Publié: (2025)
par: Ding, Yizhuo, et autres
Publié: (2025)
Sparsity Induction for Accurate Post-Training Pruning of Large Language Models
par: Jiang, Minhao, et autres
Publié: (2026)
par: Jiang, Minhao, et autres
Publié: (2026)
Think Before You Prune: Self-Reflective Structured Pruning for Reasoning Language Models
par: Wang, Ziyan, et autres
Publié: (2025)
par: Wang, Ziyan, et autres
Publié: (2025)
MaskPrune: Mask-based LLM Pruning for Layer-wise Uniform Structures
par: Qin, Jiayu, et autres
Publié: (2025)
par: Qin, Jiayu, et autres
Publié: (2025)
On the Limitations of Language Targeted Pruning: Investigating the Calibration Language Impact in Multilingual LLM Pruning
par: Kurz, Simon, et autres
Publié: (2024)
par: Kurz, Simon, et autres
Publié: (2024)
Thought Propagation: An Analogical Approach to Complex Reasoning with Large Language Models
par: Yu, Junchi, et autres
Publié: (2023)
par: Yu, Junchi, et autres
Publié: (2023)
Leveraging Importance Sampling to Detach Alignment Modules from Large Language Models
par: Liu, Yi, et autres
Publié: (2025)
par: Liu, Yi, et autres
Publié: (2025)
Beware of Calibration Data for Pruning Large Language Models
par: Ji, Yixin, et autres
Publié: (2024)
par: Ji, Yixin, et autres
Publié: (2024)
COPAL: Continual Pruning in Large Language Generative Models
par: Malla, Srikanth, et autres
Publié: (2024)
par: Malla, Srikanth, et autres
Publié: (2024)
PAT: Pruning-Aware Tuning for Large Language Models
par: Liu, Yijiang, et autres
Publié: (2024)
par: Liu, Yijiang, et autres
Publié: (2024)
ALPS: Attention Localization and Pruning Strategy for Efficient Alignment of Large Language Models
par: Chen, Hao, et autres
Publié: (2025)
par: Chen, Hao, et autres
Publié: (2025)
Systematic Weight Evaluation for Pruning Large Language Models: Enhancing Performance and Sustainability
par: Islam, Ashhadul, et autres
Publié: (2025)
par: Islam, Ashhadul, et autres
Publié: (2025)
Efficient Shapley Value-based Non-Uniform Pruning of Large Language Models
par: Sun, Chuan, et autres
Publié: (2025)
par: Sun, Chuan, et autres
Publié: (2025)
One-Shot Sensitivity-Aware Mixed Sparsity Pruning for Large Language Models
par: Shao, Hang, et autres
Publié: (2023)
par: Shao, Hang, et autres
Publié: (2023)
BriLLM: Brain-inspired Large Language Model
par: Zhao, Hai, et autres
Publié: (2025)
par: Zhao, Hai, et autres
Publié: (2025)
Forward-Backward Reasoning in Large Language Models for Mathematical Verification
par: Jiang, Weisen, et autres
Publié: (2023)
par: Jiang, Weisen, et autres
Publié: (2023)
Documents similaires
-
Adaptive Pruning for Large Language Models with Structural Importance Awareness
par: Zheng, Haotian, et autres
Publié: (2024) -
Entropy-Based Block Pruning for Efficient Large Language Models
par: Yang, Liangwei, et autres
Publié: (2025) -
Toward Adaptive Large Language Models Structured Pruning via Hybrid-grained Weight Importance Assessment
par: Liu, Jun, et autres
Publié: (2024) -
Adaptive Layer Selection for Layer-Wise Token Pruning in LLM Inference
par: Taniguchi, Rei, et autres
Publié: (2026) -
Pruning Large Language Models with Semi-Structural Adaptive Sparse Training
par: Huang, Weiyu, et autres
Publié: (2024)