:: Library Catalog

Image de couverture de livre

Enregistré dans:

Détails bibliographiques
Auteur principal:	Wu, Haihang
Format:	Preprint
Publié:	2024
Sujets:	Computation and Language Artificial Intelligence
Accès en ligne:	https://arxiv.org/abs/2412.06419
Tags:	Ajouter un tag Pas de tags, Soyez le premier à ajouter un tag!

Documents similaires

Adaptive Pruning for Large Language Models with Structural Importance Awareness
par: Zheng, Haotian, et autres
Publié: (2024)

Entropy-Based Block Pruning for Efficient Large Language Models
par: Yang, Liangwei, et autres
Publié: (2025)

Toward Adaptive Large Language Models Structured Pruning via Hybrid-grained Weight Importance Assessment
par: Liu, Jun, et autres
Publié: (2024)

Adaptive Layer Selection for Layer-Wise Token Pruning in LLM Inference
par: Taniguchi, Rei, et autres
Publié: (2026)

Pruning Large Language Models with Semi-Structural Adaptive Sparse Training
par: Huang, Weiyu, et autres
Publié: (2024)

Channel-Wise Mixed-Precision Quantization for Large Language Models
par: Chen, Zihan, et autres
Publié: (2024)

Sample-aware Adaptive Structured Pruning for Large Language Models
par: Kong, Jun, et autres
Publié: (2025)

Large Language Model Pruning
par: Huang, Hanjuan, et autres
Publié: (2024)

Large Language Model Meets Constraint Propagation
par: Bonlarron, Alexandre, et autres
Publié: (2025)

Athena: Efficient Block-Wise Post-Training Quantization for Large Language Models Using Second-Order Matrix Derivative Information
par: Wang, Yanshu, et autres
Publié: (2024)

EBFT: Effective and Block-Wise Fine-Tuning for Sparse LLMs
par: Guo, Song, et autres
Publié: (2024)

DLP: Dynamic Layerwise Pruning in Large Language Models
par: Chen, Yuli, et autres
Publié: (2025)

Prompt-based Depth Pruning of Large Language Models
par: Wee, Juyun, et autres
Publié: (2025)

DPPA: Pruning Method for Large Language Model to Model Merging
par: Zhu, Yaochen, et autres
Publié: (2024)

Pruning General Large Language Models into Customized Expert Models
par: Zhao, Yirao, et autres
Publié: (2025)

PrunePath: Towards Highly Structured Sparse Language Models
par: Gu, Zhexuan, et autres
Publié: (2026)

From Local to Global: Revisiting Structured Pruning Paradigms for Large Language Models
par: Wang, Ziyan, et autres
Publié: (2025)

Investigating Hallucinations in Pruned Large Language Models for Abstractive Summarization
par: Chrysostomou, George, et autres
Publié: (2023)

Saliency-driven Dynamic Token Pruning for Large Language Models
par: Tao, Yao, et autres
Publié: (2025)

LLM-Barber: Block-Aware Rebuilder for Sparsity Mask in One-Shot for Large Language Models
par: Su, Yupeng, et autres
Publié: (2024)

ECoFLaP: Efficient Coarse-to-Fine Layer-Wise Pruning for Vision-Language Models
par: Sung, Yi-Lin, et autres
Publié: (2023)

Khayyam Challenge (PersianMMLU): Is Your LLM Truly Wise to The Persian Language?
par: Ghahroodi, Omid, et autres
Publié: (2024)

Importance Weighting Can Help Large Language Models Self-Improve
par: Jiang, Chunyang, et autres
Publié: (2024)

LaCo: Large Language Model Pruning via Layer Collapse
par: Yang, Yifei, et autres
Publié: (2024)

Revisiting Large Language Model Pruning using Neuron Semantic Attribution
par: Ding, Yizhuo, et autres
Publié: (2025)

Sparsity Induction for Accurate Post-Training Pruning of Large Language Models
par: Jiang, Minhao, et autres
Publié: (2026)

Think Before You Prune: Self-Reflective Structured Pruning for Reasoning Language Models
par: Wang, Ziyan, et autres
Publié: (2025)

MaskPrune: Mask-based LLM Pruning for Layer-wise Uniform Structures
par: Qin, Jiayu, et autres
Publié: (2025)

On the Limitations of Language Targeted Pruning: Investigating the Calibration Language Impact in Multilingual LLM Pruning
par: Kurz, Simon, et autres
Publié: (2024)

Thought Propagation: An Analogical Approach to Complex Reasoning with Large Language Models
par: Yu, Junchi, et autres
Publié: (2023)

Leveraging Importance Sampling to Detach Alignment Modules from Large Language Models
par: Liu, Yi, et autres
Publié: (2025)

Beware of Calibration Data for Pruning Large Language Models
par: Ji, Yixin, et autres
Publié: (2024)

COPAL: Continual Pruning in Large Language Generative Models
par: Malla, Srikanth, et autres
Publié: (2024)

PAT: Pruning-Aware Tuning for Large Language Models
par: Liu, Yijiang, et autres
Publié: (2024)

ALPS: Attention Localization and Pruning Strategy for Efficient Alignment of Large Language Models
par: Chen, Hao, et autres
Publié: (2025)

Systematic Weight Evaluation for Pruning Large Language Models: Enhancing Performance and Sustainability
par: Islam, Ashhadul, et autres
Publié: (2025)

Efficient Shapley Value-based Non-Uniform Pruning of Large Language Models
par: Sun, Chuan, et autres
Publié: (2025)

One-Shot Sensitivity-Aware Mixed Sparsity Pruning for Large Language Models
par: Shao, Hang, et autres
Publié: (2023)

BriLLM: Brain-inspired Large Language Model
par: Zhao, Hai, et autres
Publié: (2025)

Forward-Backward Reasoning in Large Language Models for Mathematical Verification
par: Jiang, Weisen, et autres
Publié: (2023)