:: Library Catalog

Image de couverture de livre

Enregistré dans:

Détails bibliographiques
Auteurs principaux:	Shi, Kean, Chen, Liang, Zhao, Haozhe, Chang, Baobao
Format:	Preprint
Publié:	2025
Sujets:	Machine Learning Artificial Intelligence
Accès en ligne:	https://arxiv.org/abs/2509.18150
Tags:	Ajouter un tag Pas de tags, Soyez le premier à ajouter un tag!

Documents similaires

WiSparse: Boosting LLM Inference Efficiency with Weight-Aware Mixed Activation Sparsity
par: Chen, Lei, et autres
Publié: (2026)

Improving MoE Compute Efficiency by Composing Weight and Data Sparsity
par: Kilian, Maciej, et autres
Publié: (2026)

Improving Decision Sparsity
par: Sun, Yiyang, et autres
Publié: (2024)

ConsistRM: Improving Generative Reward Models via Consistency-Aware Self-Training
par: Liang, Yu, et autres
Publié: (2026)

ALISA: Accelerating Large Language Model Inference via Sparsity-Aware KV Caching
par: Zhao, Youpeng, et autres
Publié: (2024)

Sparsity-Aware Evolution for Model Merging
par: Zhang, Huan, et autres
Publié: (2026)

When Does Value-Aware KV Eviction Help? A Fixed-Contract Diagnostic for Non-Monotone Cache Compression
par: Zhang, Ruijie, et autres
Publié: (2026)

Maximum Redundancy Pruning: A Principle-Driven Layerwise Sparsity Allocation for LLMs
par: Gao, Chang, et autres
Publié: (2025)

The Wolf Within: Covert Injection of Malice into MLLM Societies via an MLLM Operative
par: Tan, Zhen, et autres
Publié: (2024)

Improving the Robustness of Distantly-Supervised Named Entity Recognition via Uncertainty-Aware Teacher Learning and Student-Student Collaborative Learning
par: Si, Shuzheng, et autres
Publié: (2023)

LOTUS: Improving Transformer Efficiency with Sparsity Pruning and Data Lottery Tickets
par: Upadhyay, Ojasw
Publié: (2024)

PLUM: Improving Inference Efficiency By Leveraging Repetition-Sparsity Trade-Off
par: Kuhar, Sachit, et autres
Publié: (2023)

Scaling Attention via Feature Sparsity
par: Xie, Yan, et autres
Publié: (2026)

RaaS: Reasoning-Aware Attention Sparsity for Efficient LLM Reasoning
par: Hu, Junhao, et autres
Publié: (2025)

On the Interplay Between Sparsity and Training in Deep Reinforcement Learning
par: Davelouis, Fatima, et autres
Publié: (2025)

An Efficient Training Algorithm for Models with Block-wise Sparsity
par: Zhu, Ding, et autres
Publié: (2025)

Joint Training Across Multiple Activation Sparsity Regimes
par: Wang, Haotian
Publié: (2026)

Post-Training Statistical Calibration for Higher Activation Sparsity
par: Chua, Vui Seng, et autres
Publié: (2024)

Sparsity-Aware Low-Rank Representation for Efficient Fine-Tuning of Large Language Models
par: Zhang, Longteng, et autres
Publié: (2026)

DeepSpeed Data Efficiency: Improving Deep Learning Model Quality and Training Efficiency via Efficient Data Sampling and Routing
par: Li, Conglong, et autres
Publié: (2022)

Introspective X Training: Feedback Conditioning Improves Scaling Across all LLM Training Stages
par: Cui, Brandon, et autres
Publié: (2026)

StableQAT: Stable Quantization-Aware Training at Ultra-Low Bitwidths
par: Chen, Tianyi, et autres
Publié: (2026)

Android Coach: Improve Online Agentic Training Efficiency with Single State Multiple Actions
par: Gan, Guo, et autres
Publié: (2026)

EcoSpa: Efficient Transformer Training with Coupled Sparsity
par: Xiao, Jinqi, et autres
Publié: (2025)

Activation Sparsity Opportunities for Compressing General Large Language Models
par: Dhar, Nobel, et autres
Publié: (2024)

Efficient LLM Reasoning via Variational Posterior Guidance with Efficiency Awareness
par: Chen, Zizhao, et autres
Publié: (2026)

Post-Training Sparse Attention with Double Sparsity
par: Yang, Shuo, et autres
Publié: (2024)

FDRMFL:Multi-modal Federated Feature Extraction Model Based on Information Maximization and Contrastive Learning
par: Wu, Haozhe
Publié: (2025)

AMSbench: A Comprehensive Benchmark for Evaluating MLLM Capabilities in AMS Circuits
par: Shi, Yichen, et autres
Publié: (2025)

ContextRL: Enhancing MLLM's Knowledge Discovery Efficiency with Context-Augmented RL
par: Lu, Xingyu, et autres
Publié: (2026)

Weight Concentration Regularization for Improving Pruning Robustness Under High Sparsity
par: Yun, Vincent-Daniel, et autres
Publié: (2025)

ELAS: Efficient Pre-Training of Low-Rank Large Language Models via 2:4 Activation Sparsity
par: Li, Jiaxi, et autres
Publié: (2026)

Concept Influence: Leveraging Interpretability to Improve Performance and Efficiency in Training Data Attribution
par: Kowal, Matthew, et autres
Publié: (2026)

RationalRewards: Reasoning Rewards Scale Visual Generation Both Training and Test Time
par: Wang, Haozhe, et autres
Publié: (2026)

MLLM Is a Strong Reranker: Advancing Multimodal Retrieval-augmented Generation via Knowledge-enhanced Reranking and Noise-injected Training
par: Chen, Zhanpeng, et autres
Publié: (2024)

Memory-Efficient LLM Training with Dynamic Sparsity: From Stability to Practical Scaling
par: Xiao, Qiao, et autres
Publié: (2026)

Towards the Connection between Activation Sparsity and Flat Minima
par: Peng, Ze, et autres
Publié: (2026)

ES-Merging: Biological MLLM Merging via Embedding Space Signals
par: Lee, Wonbin, et autres
Publié: (2026)

Sparse-Reg: Improving Sample Complexity in Offline Reinforcement Learning using Sparsity
par: Arnob, Samin Yeasar, et autres
Publié: (2025)

Mitigating Language-Level Performance Disparity in mPLMs via Teacher Language Selection and Cross-lingual Self-Distillation
par: Zhao, Haozhe, et autres
Publié: (2024)