:: Library Catalog

Imagen de Portada

Guardado en:

Detalles Bibliográficos
Autores principales:	Li, Zekai, Zheng, Jintu, Liu, Ji, Liu, Han, Zhu, Haowei, Li, Zeping, Yang, Fuwei, Huang, Haiduo, Peng, Jinzhang, Li, Dong, Tian, Lu, Barsoum, Emad
Formato:	Preprint
Publicado:	2024
Materias:	Computation and Language
Acceso en línea:	https://arxiv.org/abs/2412.11494
Etiquetas:	Agregar Etiqueta Sin Etiquetas, Sea el primero en etiquetar este registro!

Ejemplares similares

Partial Convolution Meets Visual Attention
por: Huang, Haiduo, et al.
Publicado: (2025)

DiP-GO: A Diffusion Pruner via Few-step Gradient Optimization
por: Zhu, Haowei, et al.
Publicado: (2024)

Týr-the-Pruner: Structural Pruning LLMs via Global Sparsity Distribution Optimization
por: Li, Guanchen, et al.
Publicado: (2025)

DiffSparse: Accelerating Diffusion Transformers with Learned Token Sparsity
por: Zhu, Haowei, et al.
Publicado: (2026)

SpecVLM: Fast Speculative Decoding in Vision-Language Models
por: Huang, Haiduo, et al.
Publicado: (2025)

Amphista: Bi-directional Multi-head Decoding for Accelerating LLM Inference
por: Li, Zeping, et al.
Publicado: (2024)

Gumiho: A Hybrid Architecture to Prioritize Early Tokens in Speculative Decoding
por: Li, Jinze, et al.
Publicado: (2025)

Jakiro: Boosting Speculative Decoding with Decoupled Multi-Head via MoE
por: Huang, Haiduo, et al.
Publicado: (2025)

Fast Occupancy Network
por: Lu, Mingjie, et al.
Publicado: (2024)

VIPS-Odom: Visual-Inertial Odometry Tightly-coupled with Parking Slots for Autonomous Parking
por: Jiang, Xuefeng, et al.
Publicado: (2024)

EGSRAL: An Enhanced 3D Gaussian Splatting based Renderer with Automated Labeling for Large-Scale Driving Scene
por: Huo, Yixiong, et al.
Publicado: (2024)

UPDP: A Unified Progressive Depth Pruner for CNN and Vision Transformer
por: Liu, Ji, et al.
Publicado: (2024)

Sparse Laneformer
por: Liu, Ji, et al.
Publicado: (2024)

MI-Pruner: Crossmodal Mutual Information-guided Token Pruner for Efficient MLLMs
por: Li, Jiameng, et al.
Publicado: (2026)

Learnable Permutation for Structured Sparsity on Transformer Models
por: Li, Zekai, et al.
Publicado: (2026)

Pip-Stereo: Progressive Iterations Pruner for Iterative Optimization based Stereo Matching
por: Zheng, Jintu, et al.
Publicado: (2026)

BlockPruner: Fine-grained Pruning for Large Language Models
por: Zhong, Longguang, et al.
Publicado: (2024)

Enhancing One-shot Pruned Pre-trained Language Models through Sparse-Dense-Sparse Mechanism
por: Li, Guanchen, et al.
Publicado: (2024)

DL-QAT: Weight-Decomposed Low-Rank Quantization-Aware Training for Large Language Models
por: Ke, Wenjin, et al.
Publicado: (2025)

DUET-VLM: Dual stage Unified Efficient Token reduction for VLM Training and Inference
por: Singh, Aditya Kumar, et al.
Publicado: (2026)

SoftVQ-VAE: Efficient 1-Dimensional Continuous Tokenizer
por: Chen, Hao, et al.
Publicado: (2024)

Beyond Token Length: Step Pruner for Efficient and Accurate Reasoning in Large Language Models
por: Wu, Canhui, et al.
Publicado: (2025)

MonoGS++: Fast and Accurate Monocular RGB Gaussian SLAM
por: Li, Renwu, et al.
Publicado: (2025)

PARD: Accelerating LLM Inference with Low-Cost PARallel Draft Model Adaptation
por: An, Zihao, et al.
Publicado: (2025)

TCM-FTP: Fine-Tuning Large Language Models for Herbal Prescription Prediction
por: Zhou, Xingzhi, et al.
Publicado: (2024)

LearnPruner: Rethinking Attention-based Token Pruning in Vision Language Models
por: Takezoe, Rinyoichi, et al.
Publicado: (2026)

SelecTKD: Selective Token-Weighted Knowledge Distillation for LLMs
por: Huang, Haiduo, et al.
Publicado: (2025)

A Convex-optimization-based Layer-wise Post-training Pruner for Large Language Models
por: Zhao, Pengxiang, et al.
Publicado: (2024)

PARD-2: Target-Aligned Parallel Draft Model for Dual-Mode Speculative Decoding
por: An, Zihao, et al.
Publicado: (2026)

LADDER: An Efficient Framework for Video Frame Interpolation
por: Shen, Tong, et al.
Publicado: (2024)

MSWA: Refining Local Attention with Multi-ScaleWindow Attention
por: Xu, Yixing, et al.
Publicado: (2025)

SeGPruner: Semantic-Geometric Visual Token Pruner for 3D Question Answering
por: Li, Wenli, et al.
Publicado: (2026)

Multiplex Thinking: Reasoning via Token-wise Branch-and-Merge
por: Tang, Yao, et al.
Publicado: (2026)

Enhancing Large Language Model Reasoning via Selective Critical Token Fine-Tuning
por: Ruan, Zhiwen, et al.
Publicado: (2025)

Unidos por un futuro mejor / Li Jinzhang
por: Li Jinzhang

Unidos por un futuro mejor / Li Jinzhang
por: Li Jinzhang

VLM-Pruner: Buffering for Spatial Sparsity in an Efficient VLM Centrifugal Token Pruning Paradigm
por: Wu, Zhenkai, et al.
Publicado: (2025)

ToDi: Token-wise Distillation via Fine-Grained Divergence Control
por: Jung, Seongryong, et al.
Publicado: (2025)

MedPruner: Training-Free Hierarchical Token Pruning for Efficient 3D Medical Image Understanding in Vision-Language Models
por: Liu, Shengyuan, et al.
Publicado: (2026)

DiffBench Meets DiffAgent: End-to-End LLM-Driven Diffusion Acceleration Code Generation
por: jiao, Jiajun, et al.
Publicado: (2026)