Enregistré dans:
| Auteurs principaux: | Shi, Kean, Chen, Liang, Zhao, Haozhe, Chang, Baobao |
|---|---|
| Format: | Preprint |
| Publié: |
2025
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2509.18150 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
WiSparse: Boosting LLM Inference Efficiency with Weight-Aware Mixed Activation Sparsity
par: Chen, Lei, et autres
Publié: (2026)
par: Chen, Lei, et autres
Publié: (2026)
Improving MoE Compute Efficiency by Composing Weight and Data Sparsity
par: Kilian, Maciej, et autres
Publié: (2026)
par: Kilian, Maciej, et autres
Publié: (2026)
Improving Decision Sparsity
par: Sun, Yiyang, et autres
Publié: (2024)
par: Sun, Yiyang, et autres
Publié: (2024)
ConsistRM: Improving Generative Reward Models via Consistency-Aware Self-Training
par: Liang, Yu, et autres
Publié: (2026)
par: Liang, Yu, et autres
Publié: (2026)
ALISA: Accelerating Large Language Model Inference via Sparsity-Aware KV Caching
par: Zhao, Youpeng, et autres
Publié: (2024)
par: Zhao, Youpeng, et autres
Publié: (2024)
Sparsity-Aware Evolution for Model Merging
par: Zhang, Huan, et autres
Publié: (2026)
par: Zhang, Huan, et autres
Publié: (2026)
When Does Value-Aware KV Eviction Help? A Fixed-Contract Diagnostic for Non-Monotone Cache Compression
par: Zhang, Ruijie, et autres
Publié: (2026)
par: Zhang, Ruijie, et autres
Publié: (2026)
Maximum Redundancy Pruning: A Principle-Driven Layerwise Sparsity Allocation for LLMs
par: Gao, Chang, et autres
Publié: (2025)
par: Gao, Chang, et autres
Publié: (2025)
The Wolf Within: Covert Injection of Malice into MLLM Societies via an MLLM Operative
par: Tan, Zhen, et autres
Publié: (2024)
par: Tan, Zhen, et autres
Publié: (2024)
Improving the Robustness of Distantly-Supervised Named Entity Recognition via Uncertainty-Aware Teacher Learning and Student-Student Collaborative Learning
par: Si, Shuzheng, et autres
Publié: (2023)
par: Si, Shuzheng, et autres
Publié: (2023)
LOTUS: Improving Transformer Efficiency with Sparsity Pruning and Data Lottery Tickets
par: Upadhyay, Ojasw
Publié: (2024)
par: Upadhyay, Ojasw
Publié: (2024)
PLUM: Improving Inference Efficiency By Leveraging Repetition-Sparsity Trade-Off
par: Kuhar, Sachit, et autres
Publié: (2023)
par: Kuhar, Sachit, et autres
Publié: (2023)
Scaling Attention via Feature Sparsity
par: Xie, Yan, et autres
Publié: (2026)
par: Xie, Yan, et autres
Publié: (2026)
RaaS: Reasoning-Aware Attention Sparsity for Efficient LLM Reasoning
par: Hu, Junhao, et autres
Publié: (2025)
par: Hu, Junhao, et autres
Publié: (2025)
On the Interplay Between Sparsity and Training in Deep Reinforcement Learning
par: Davelouis, Fatima, et autres
Publié: (2025)
par: Davelouis, Fatima, et autres
Publié: (2025)
An Efficient Training Algorithm for Models with Block-wise Sparsity
par: Zhu, Ding, et autres
Publié: (2025)
par: Zhu, Ding, et autres
Publié: (2025)
Joint Training Across Multiple Activation Sparsity Regimes
par: Wang, Haotian
Publié: (2026)
par: Wang, Haotian
Publié: (2026)
Post-Training Statistical Calibration for Higher Activation Sparsity
par: Chua, Vui Seng, et autres
Publié: (2024)
par: Chua, Vui Seng, et autres
Publié: (2024)
Sparsity-Aware Low-Rank Representation for Efficient Fine-Tuning of Large Language Models
par: Zhang, Longteng, et autres
Publié: (2026)
par: Zhang, Longteng, et autres
Publié: (2026)
DeepSpeed Data Efficiency: Improving Deep Learning Model Quality and Training Efficiency via Efficient Data Sampling and Routing
par: Li, Conglong, et autres
Publié: (2022)
par: Li, Conglong, et autres
Publié: (2022)
Introspective X Training: Feedback Conditioning Improves Scaling Across all LLM Training Stages
par: Cui, Brandon, et autres
Publié: (2026)
par: Cui, Brandon, et autres
Publié: (2026)
StableQAT: Stable Quantization-Aware Training at Ultra-Low Bitwidths
par: Chen, Tianyi, et autres
Publié: (2026)
par: Chen, Tianyi, et autres
Publié: (2026)
Android Coach: Improve Online Agentic Training Efficiency with Single State Multiple Actions
par: Gan, Guo, et autres
Publié: (2026)
par: Gan, Guo, et autres
Publié: (2026)
EcoSpa: Efficient Transformer Training with Coupled Sparsity
par: Xiao, Jinqi, et autres
Publié: (2025)
par: Xiao, Jinqi, et autres
Publié: (2025)
Activation Sparsity Opportunities for Compressing General Large Language Models
par: Dhar, Nobel, et autres
Publié: (2024)
par: Dhar, Nobel, et autres
Publié: (2024)
Efficient LLM Reasoning via Variational Posterior Guidance with Efficiency Awareness
par: Chen, Zizhao, et autres
Publié: (2026)
par: Chen, Zizhao, et autres
Publié: (2026)
Post-Training Sparse Attention with Double Sparsity
par: Yang, Shuo, et autres
Publié: (2024)
par: Yang, Shuo, et autres
Publié: (2024)
FDRMFL:Multi-modal Federated Feature Extraction Model Based on Information Maximization and Contrastive Learning
par: Wu, Haozhe
Publié: (2025)
par: Wu, Haozhe
Publié: (2025)
AMSbench: A Comprehensive Benchmark for Evaluating MLLM Capabilities in AMS Circuits
par: Shi, Yichen, et autres
Publié: (2025)
par: Shi, Yichen, et autres
Publié: (2025)
ContextRL: Enhancing MLLM's Knowledge Discovery Efficiency with Context-Augmented RL
par: Lu, Xingyu, et autres
Publié: (2026)
par: Lu, Xingyu, et autres
Publié: (2026)
Weight Concentration Regularization for Improving Pruning Robustness Under High Sparsity
par: Yun, Vincent-Daniel, et autres
Publié: (2025)
par: Yun, Vincent-Daniel, et autres
Publié: (2025)
ELAS: Efficient Pre-Training of Low-Rank Large Language Models via 2:4 Activation Sparsity
par: Li, Jiaxi, et autres
Publié: (2026)
par: Li, Jiaxi, et autres
Publié: (2026)
Concept Influence: Leveraging Interpretability to Improve Performance and Efficiency in Training Data Attribution
par: Kowal, Matthew, et autres
Publié: (2026)
par: Kowal, Matthew, et autres
Publié: (2026)
RationalRewards: Reasoning Rewards Scale Visual Generation Both Training and Test Time
par: Wang, Haozhe, et autres
Publié: (2026)
par: Wang, Haozhe, et autres
Publié: (2026)
MLLM Is a Strong Reranker: Advancing Multimodal Retrieval-augmented Generation via Knowledge-enhanced Reranking and Noise-injected Training
par: Chen, Zhanpeng, et autres
Publié: (2024)
par: Chen, Zhanpeng, et autres
Publié: (2024)
Memory-Efficient LLM Training with Dynamic Sparsity: From Stability to Practical Scaling
par: Xiao, Qiao, et autres
Publié: (2026)
par: Xiao, Qiao, et autres
Publié: (2026)
Towards the Connection between Activation Sparsity and Flat Minima
par: Peng, Ze, et autres
Publié: (2026)
par: Peng, Ze, et autres
Publié: (2026)
ES-Merging: Biological MLLM Merging via Embedding Space Signals
par: Lee, Wonbin, et autres
Publié: (2026)
par: Lee, Wonbin, et autres
Publié: (2026)
Sparse-Reg: Improving Sample Complexity in Offline Reinforcement Learning using Sparsity
par: Arnob, Samin Yeasar, et autres
Publié: (2025)
par: Arnob, Samin Yeasar, et autres
Publié: (2025)
Mitigating Language-Level Performance Disparity in mPLMs via Teacher Language Selection and Cross-lingual Self-Distillation
par: Zhao, Haozhe, et autres
Publié: (2024)
par: Zhao, Haozhe, et autres
Publié: (2024)
Documents similaires
-
WiSparse: Boosting LLM Inference Efficiency with Weight-Aware Mixed Activation Sparsity
par: Chen, Lei, et autres
Publié: (2026) -
Improving MoE Compute Efficiency by Composing Weight and Data Sparsity
par: Kilian, Maciej, et autres
Publié: (2026) -
Improving Decision Sparsity
par: Sun, Yiyang, et autres
Publié: (2024) -
ConsistRM: Improving Generative Reward Models via Consistency-Aware Self-Training
par: Liang, Yu, et autres
Publié: (2026) -
ALISA: Accelerating Large Language Model Inference via Sparsity-Aware KV Caching
par: Zhao, Youpeng, et autres
Publié: (2024)