Gespeichert in:
| Hauptverfasser: | Wang, Ziyang, Xiao, Jiangfeng, Xiao, Chuan, Li, Ruoxiang, Mao, Rui, Qin, Jianbin |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2026
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2604.19398 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
SlimGPT: Layer-wise Structured Pruning for Large Language Models
von: Ling, Gui, et al.
Veröffentlicht: (2024)
von: Ling, Gui, et al.
Veröffentlicht: (2024)
MODIX: A Training-Free Multimodal Information-Driven Positional Index Scaling for Vision-Language Models
von: Huang, Ruoxiang, et al.
Veröffentlicht: (2026)
von: Huang, Ruoxiang, et al.
Veröffentlicht: (2026)
From Local to Global: Revisiting Structured Pruning Paradigms for Large Language Models
von: Wang, Ziyan, et al.
Veröffentlicht: (2025)
von: Wang, Ziyan, et al.
Veröffentlicht: (2025)
Efficient Shapley Value-based Non-Uniform Pruning of Large Language Models
von: Sun, Chuan, et al.
Veröffentlicht: (2025)
von: Sun, Chuan, et al.
Veröffentlicht: (2025)
Large Language Models as Data Preprocessors
von: Zhang, Haochen, et al.
Veröffentlicht: (2023)
von: Zhang, Haochen, et al.
Veröffentlicht: (2023)
Affective Flow Language Model for Emotional Support Conversation
von: Zou, Chenghui, et al.
Veröffentlicht: (2026)
von: Zou, Chenghui, et al.
Veröffentlicht: (2026)
Phased Instruction Fine-Tuning for Large Language Models
von: Pang, Wei, et al.
Veröffentlicht: (2024)
von: Pang, Wei, et al.
Veröffentlicht: (2024)
Open-SQL Framework: Enhancing Text-to-SQL on Open-source Large Language Models
von: Chen, Xiaojun, et al.
Veröffentlicht: (2024)
von: Chen, Xiaojun, et al.
Veröffentlicht: (2024)
DPPA: Pruning Method for Large Language Model to Model Merging
von: Zhu, Yaochen, et al.
Veröffentlicht: (2024)
von: Zhu, Yaochen, et al.
Veröffentlicht: (2024)
ALPS: Attention Localization and Pruning Strategy for Efficient Alignment of Large Language Models
von: Chen, Hao, et al.
Veröffentlicht: (2025)
von: Chen, Hao, et al.
Veröffentlicht: (2025)
Exploring Federated Pruning for Large Language Models
von: Guo, Pengxin, et al.
Veröffentlicht: (2025)
von: Guo, Pengxin, et al.
Veröffentlicht: (2025)
One-Shot Sensitivity-Aware Mixed Sparsity Pruning for Large Language Models
von: Shao, Hang, et al.
Veröffentlicht: (2023)
von: Shao, Hang, et al.
Veröffentlicht: (2023)
Sample-aware Adaptive Structured Pruning for Large Language Models
von: Kong, Jun, et al.
Veröffentlicht: (2025)
von: Kong, Jun, et al.
Veröffentlicht: (2025)
The Structural Scalpel: Automated Contiguous Layer Pruning for Large Language Models
von: Lu, Yao, et al.
Veröffentlicht: (2025)
von: Lu, Yao, et al.
Veröffentlicht: (2025)
Toward Graph-Tokenizing Large Language Models with Reconstructive Graph Instruction Tuning
von: Zhang, Zhongjian, et al.
Veröffentlicht: (2026)
von: Zhang, Zhongjian, et al.
Veröffentlicht: (2026)
CoViPAL: Layer-wise Contextualized Visual Token Pruning for Large Vision-Language Models
von: Tang, Zicong, et al.
Veröffentlicht: (2025)
von: Tang, Zicong, et al.
Veröffentlicht: (2025)
Adaptive Pruning for Large Language Models with Structural Importance Awareness
von: Zheng, Haotian, et al.
Veröffentlicht: (2024)
von: Zheng, Haotian, et al.
Veröffentlicht: (2024)
Data Overvaluation Attack and Truthful Data Valuation in Federated Learning
von: Zheng, Shuyuan, et al.
Veröffentlicht: (2025)
von: Zheng, Shuyuan, et al.
Veröffentlicht: (2025)
Jellyfish: A Large Language Model for Data Preprocessing
von: Zhang, Haochen, et al.
Veröffentlicht: (2023)
von: Zhang, Haochen, et al.
Veröffentlicht: (2023)
Understanding Performance Collapse in Layer-Pruned Large Language Models via Decision Representation Transitions
von: Shi, Boyu, et al.
Veröffentlicht: (2026)
von: Shi, Boyu, et al.
Veröffentlicht: (2026)
BIPEFT: Budget-Guided Iterative Search for Parameter Efficient Fine-Tuning of Large Pretrained Language Models
von: Chang, Aofei, et al.
Veröffentlicht: (2024)
von: Chang, Aofei, et al.
Veröffentlicht: (2024)
Training Large Language Models To Reason In Parallel With Global Forking Tokens
von: Jia, Sheng, et al.
Veröffentlicht: (2025)
von: Jia, Sheng, et al.
Veröffentlicht: (2025)
Adaptive Layer Selection for Layer-Wise Token Pruning in LLM Inference
von: Taniguchi, Rei, et al.
Veröffentlicht: (2026)
von: Taniguchi, Rei, et al.
Veröffentlicht: (2026)
GPrune-LLM: Generalization-Aware Structured Pruning for Large Language Models
von: Liu, Xiaoyun, et al.
Veröffentlicht: (2026)
von: Liu, Xiaoyun, et al.
Veröffentlicht: (2026)
Pruning Large Language Models with Semi-Structural Adaptive Sparse Training
von: Huang, Weiyu, et al.
Veröffentlicht: (2024)
von: Huang, Weiyu, et al.
Veröffentlicht: (2024)
Think Before You Prune: Self-Reflective Structured Pruning for Reasoning Language Models
von: Wang, Ziyan, et al.
Veröffentlicht: (2025)
von: Wang, Ziyan, et al.
Veröffentlicht: (2025)
SwapMoE: Serving Off-the-shelf MoE-based Large Language Models with Tunable Memory Budget
von: Kong, Rui, et al.
Veröffentlicht: (2023)
von: Kong, Rui, et al.
Veröffentlicht: (2023)
DAE-Fuse: An Adaptive Discriminative Autoencoder for Multi-Modality Image Fusion
von: Guo, Yuchen, et al.
Veröffentlicht: (2024)
von: Guo, Yuchen, et al.
Veröffentlicht: (2024)
The Cases LJP Never Sees: Prosecution Decision Prediction for More Complete Criminal Liability Assessment
von: Lu, Junyu, et al.
Veröffentlicht: (2026)
von: Lu, Junyu, et al.
Veröffentlicht: (2026)
TransPrune: Token Transition Pruning for Efficient Large Vision-Language Model
von: Li, Ao, et al.
Veröffentlicht: (2025)
von: Li, Ao, et al.
Veröffentlicht: (2025)
Symmetric Pruning of Large Language Models
von: Yi, Kai, et al.
Veröffentlicht: (2025)
von: Yi, Kai, et al.
Veröffentlicht: (2025)
Large Language Model Pruning
von: Huang, Hanjuan, et al.
Veröffentlicht: (2024)
von: Huang, Hanjuan, et al.
Veröffentlicht: (2024)
Less is More: on the Over-Globalizing Problem in Graph Transformers
von: Xing, Yujie, et al.
Veröffentlicht: (2024)
von: Xing, Yujie, et al.
Veröffentlicht: (2024)
Enhancing Conversational Recommender Systems with Tree-Structured Knowledge and Pretrained Language Models
von: Ren, Yongwen, et al.
Veröffentlicht: (2025)
von: Ren, Yongwen, et al.
Veröffentlicht: (2025)
Beware of Calibration Data for Pruning Large Language Models
von: Ji, Yixin, et al.
Veröffentlicht: (2024)
von: Ji, Yixin, et al.
Veröffentlicht: (2024)
SwiftPrune: Hessian-Free Weight Pruning for Large Language Models
von: Kang, Yuhan, et al.
Veröffentlicht: (2025)
von: Kang, Yuhan, et al.
Veröffentlicht: (2025)
DLP: Dynamic Layerwise Pruning in Large Language Models
von: Chen, Yuli, et al.
Veröffentlicht: (2025)
von: Chen, Yuli, et al.
Veröffentlicht: (2025)
PAT: Pruning-Aware Tuning for Large Language Models
von: Liu, Yijiang, et al.
Veröffentlicht: (2024)
von: Liu, Yijiang, et al.
Veröffentlicht: (2024)
Liger: Linearizing Large Language Models to Gated Recurrent Structures
von: Lan, Disen, et al.
Veröffentlicht: (2025)
von: Lan, Disen, et al.
Veröffentlicht: (2025)
The Emergence of Altruism in Large-Language-Model Agents Society
von: Li, Haoyang, et al.
Veröffentlicht: (2025)
von: Li, Haoyang, et al.
Veröffentlicht: (2025)
Ähnliche Einträge
-
SlimGPT: Layer-wise Structured Pruning for Large Language Models
von: Ling, Gui, et al.
Veröffentlicht: (2024) -
MODIX: A Training-Free Multimodal Information-Driven Positional Index Scaling for Vision-Language Models
von: Huang, Ruoxiang, et al.
Veröffentlicht: (2026) -
From Local to Global: Revisiting Structured Pruning Paradigms for Large Language Models
von: Wang, Ziyan, et al.
Veröffentlicht: (2025) -
Efficient Shapley Value-based Non-Uniform Pruning of Large Language Models
von: Sun, Chuan, et al.
Veröffentlicht: (2025) -
Large Language Models as Data Preprocessors
von: Zhang, Haochen, et al.
Veröffentlicht: (2023)