Guardado en:
| Autores principales: | Li, Zekai, Zheng, Jintu, Liu, Ji, Liu, Han, Zhu, Haowei, Li, Zeping, Yang, Fuwei, Huang, Haiduo, Peng, Jinzhang, Li, Dong, Tian, Lu, Barsoum, Emad |
|---|---|
| Formato: | Preprint |
| Publicado: |
2024
|
| Materias: | |
| Acceso en línea: | https://arxiv.org/abs/2412.11494 |
| Etiquetas: |
Agregar Etiqueta
Sin Etiquetas, Sea el primero en etiquetar este registro!
|
Ejemplares similares
Partial Convolution Meets Visual Attention
por: Huang, Haiduo, et al.
Publicado: (2025)
por: Huang, Haiduo, et al.
Publicado: (2025)
DiP-GO: A Diffusion Pruner via Few-step Gradient Optimization
por: Zhu, Haowei, et al.
Publicado: (2024)
por: Zhu, Haowei, et al.
Publicado: (2024)
Týr-the-Pruner: Structural Pruning LLMs via Global Sparsity Distribution Optimization
por: Li, Guanchen, et al.
Publicado: (2025)
por: Li, Guanchen, et al.
Publicado: (2025)
DiffSparse: Accelerating Diffusion Transformers with Learned Token Sparsity
por: Zhu, Haowei, et al.
Publicado: (2026)
por: Zhu, Haowei, et al.
Publicado: (2026)
SpecVLM: Fast Speculative Decoding in Vision-Language Models
por: Huang, Haiduo, et al.
Publicado: (2025)
por: Huang, Haiduo, et al.
Publicado: (2025)
Amphista: Bi-directional Multi-head Decoding for Accelerating LLM Inference
por: Li, Zeping, et al.
Publicado: (2024)
por: Li, Zeping, et al.
Publicado: (2024)
Gumiho: A Hybrid Architecture to Prioritize Early Tokens in Speculative Decoding
por: Li, Jinze, et al.
Publicado: (2025)
por: Li, Jinze, et al.
Publicado: (2025)
Jakiro: Boosting Speculative Decoding with Decoupled Multi-Head via MoE
por: Huang, Haiduo, et al.
Publicado: (2025)
por: Huang, Haiduo, et al.
Publicado: (2025)
Fast Occupancy Network
por: Lu, Mingjie, et al.
Publicado: (2024)
por: Lu, Mingjie, et al.
Publicado: (2024)
VIPS-Odom: Visual-Inertial Odometry Tightly-coupled with Parking Slots for Autonomous Parking
por: Jiang, Xuefeng, et al.
Publicado: (2024)
por: Jiang, Xuefeng, et al.
Publicado: (2024)
EGSRAL: An Enhanced 3D Gaussian Splatting based Renderer with Automated Labeling for Large-Scale Driving Scene
por: Huo, Yixiong, et al.
Publicado: (2024)
por: Huo, Yixiong, et al.
Publicado: (2024)
UPDP: A Unified Progressive Depth Pruner for CNN and Vision Transformer
por: Liu, Ji, et al.
Publicado: (2024)
por: Liu, Ji, et al.
Publicado: (2024)
Sparse Laneformer
por: Liu, Ji, et al.
Publicado: (2024)
por: Liu, Ji, et al.
Publicado: (2024)
MI-Pruner: Crossmodal Mutual Information-guided Token Pruner for Efficient MLLMs
por: Li, Jiameng, et al.
Publicado: (2026)
por: Li, Jiameng, et al.
Publicado: (2026)
Learnable Permutation for Structured Sparsity on Transformer Models
por: Li, Zekai, et al.
Publicado: (2026)
por: Li, Zekai, et al.
Publicado: (2026)
Pip-Stereo: Progressive Iterations Pruner for Iterative Optimization based Stereo Matching
por: Zheng, Jintu, et al.
Publicado: (2026)
por: Zheng, Jintu, et al.
Publicado: (2026)
BlockPruner: Fine-grained Pruning for Large Language Models
por: Zhong, Longguang, et al.
Publicado: (2024)
por: Zhong, Longguang, et al.
Publicado: (2024)
Enhancing One-shot Pruned Pre-trained Language Models through Sparse-Dense-Sparse Mechanism
por: Li, Guanchen, et al.
Publicado: (2024)
por: Li, Guanchen, et al.
Publicado: (2024)
DL-QAT: Weight-Decomposed Low-Rank Quantization-Aware Training for Large Language Models
por: Ke, Wenjin, et al.
Publicado: (2025)
por: Ke, Wenjin, et al.
Publicado: (2025)
DUET-VLM: Dual stage Unified Efficient Token reduction for VLM Training and Inference
por: Singh, Aditya Kumar, et al.
Publicado: (2026)
por: Singh, Aditya Kumar, et al.
Publicado: (2026)
SoftVQ-VAE: Efficient 1-Dimensional Continuous Tokenizer
por: Chen, Hao, et al.
Publicado: (2024)
por: Chen, Hao, et al.
Publicado: (2024)
Beyond Token Length: Step Pruner for Efficient and Accurate Reasoning in Large Language Models
por: Wu, Canhui, et al.
Publicado: (2025)
por: Wu, Canhui, et al.
Publicado: (2025)
MonoGS++: Fast and Accurate Monocular RGB Gaussian SLAM
por: Li, Renwu, et al.
Publicado: (2025)
por: Li, Renwu, et al.
Publicado: (2025)
PARD: Accelerating LLM Inference with Low-Cost PARallel Draft Model Adaptation
por: An, Zihao, et al.
Publicado: (2025)
por: An, Zihao, et al.
Publicado: (2025)
TCM-FTP: Fine-Tuning Large Language Models for Herbal Prescription Prediction
por: Zhou, Xingzhi, et al.
Publicado: (2024)
por: Zhou, Xingzhi, et al.
Publicado: (2024)
LearnPruner: Rethinking Attention-based Token Pruning in Vision Language Models
por: Takezoe, Rinyoichi, et al.
Publicado: (2026)
por: Takezoe, Rinyoichi, et al.
Publicado: (2026)
SelecTKD: Selective Token-Weighted Knowledge Distillation for LLMs
por: Huang, Haiduo, et al.
Publicado: (2025)
por: Huang, Haiduo, et al.
Publicado: (2025)
A Convex-optimization-based Layer-wise Post-training Pruner for Large Language Models
por: Zhao, Pengxiang, et al.
Publicado: (2024)
por: Zhao, Pengxiang, et al.
Publicado: (2024)
PARD-2: Target-Aligned Parallel Draft Model for Dual-Mode Speculative Decoding
por: An, Zihao, et al.
Publicado: (2026)
por: An, Zihao, et al.
Publicado: (2026)
LADDER: An Efficient Framework for Video Frame Interpolation
por: Shen, Tong, et al.
Publicado: (2024)
por: Shen, Tong, et al.
Publicado: (2024)
MSWA: Refining Local Attention with Multi-ScaleWindow Attention
por: Xu, Yixing, et al.
Publicado: (2025)
por: Xu, Yixing, et al.
Publicado: (2025)
SeGPruner: Semantic-Geometric Visual Token Pruner for 3D Question Answering
por: Li, Wenli, et al.
Publicado: (2026)
por: Li, Wenli, et al.
Publicado: (2026)
Multiplex Thinking: Reasoning via Token-wise Branch-and-Merge
por: Tang, Yao, et al.
Publicado: (2026)
por: Tang, Yao, et al.
Publicado: (2026)
Enhancing Large Language Model Reasoning via Selective Critical Token Fine-Tuning
por: Ruan, Zhiwen, et al.
Publicado: (2025)
por: Ruan, Zhiwen, et al.
Publicado: (2025)
Unidos por un futuro mejor / Li Jinzhang
por: Li Jinzhang
por: Li Jinzhang
Unidos por un futuro mejor / Li Jinzhang
por: Li Jinzhang
por: Li Jinzhang
VLM-Pruner: Buffering for Spatial Sparsity in an Efficient VLM Centrifugal Token Pruning Paradigm
por: Wu, Zhenkai, et al.
Publicado: (2025)
por: Wu, Zhenkai, et al.
Publicado: (2025)
ToDi: Token-wise Distillation via Fine-Grained Divergence Control
por: Jung, Seongryong, et al.
Publicado: (2025)
por: Jung, Seongryong, et al.
Publicado: (2025)
MedPruner: Training-Free Hierarchical Token Pruning for Efficient 3D Medical Image Understanding in Vision-Language Models
por: Liu, Shengyuan, et al.
Publicado: (2026)
por: Liu, Shengyuan, et al.
Publicado: (2026)
DiffBench Meets DiffAgent: End-to-End LLM-Driven Diffusion Acceleration Code Generation
por: jiao, Jiajun, et al.
Publicado: (2026)
por: jiao, Jiajun, et al.
Publicado: (2026)
Ejemplares similares
-
Partial Convolution Meets Visual Attention
por: Huang, Haiduo, et al.
Publicado: (2025) -
DiP-GO: A Diffusion Pruner via Few-step Gradient Optimization
por: Zhu, Haowei, et al.
Publicado: (2024) -
Týr-the-Pruner: Structural Pruning LLMs via Global Sparsity Distribution Optimization
por: Li, Guanchen, et al.
Publicado: (2025) -
DiffSparse: Accelerating Diffusion Transformers with Learned Token Sparsity
por: Zhu, Haowei, et al.
Publicado: (2026) -
SpecVLM: Fast Speculative Decoding in Vision-Language Models
por: Huang, Haiduo, et al.
Publicado: (2025)