Salvato in:
| Autori principali: | Tang, Yixin, Guo, Jiawei, Li, Junxian, Li, Zhiteng, Zhao, Jixin, Zhang, Bingya, Wang, Chenbo, Zhang, Yulun, Zhou, Shangchen |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2026
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2605.09003 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
FlashEdit: Decoupling Speed, Structure, and Semantics for Precise Image Editing
di: Wu, Junyi, et al.
Pubblicazione: (2025)
di: Wu, Junyi, et al.
Pubblicazione: (2025)
QuantCache: Adaptive Importance-Guided Quantization with Hierarchical Latent and Layer Caching for Video Generation
di: Wu, Junyi, et al.
Pubblicazione: (2025)
di: Wu, Junyi, et al.
Pubblicazione: (2025)
Precise Object and Effect Removal with Adaptive Target-Aware Attention
di: Zhao, Jixin, et al.
Pubblicazione: (2025)
di: Zhao, Jixin, et al.
Pubblicazione: (2025)
GHOST: Geometry-Hierarchical Online Streaming Token Eviction for Efficient 3D Reconstruction
di: Chen, Leyang, et al.
Pubblicazione: (2026)
di: Chen, Leyang, et al.
Pubblicazione: (2026)
ReCalKV: Low-Rank KV Cache Compression via Head Reordering and Offline Calibration
di: Yan, Xianglong, et al.
Pubblicazione: (2025)
di: Yan, Xianglong, et al.
Pubblicazione: (2025)
Progressive Binarization with Semi-Structured Pruning for LLMs
di: Yan, Xianglong, et al.
Pubblicazione: (2025)
di: Yan, Xianglong, et al.
Pubblicazione: (2025)
Flash-VL 2B: Optimizing Vision-Language Model Performance for Ultra-Low Latency and High Throughput
di: Zhang, Bo, et al.
Pubblicazione: (2025)
di: Zhang, Bo, et al.
Pubblicazione: (2025)
Compression-Aware One-Step Diffusion Model for JPEG Artifact Removal
di: Guo, Jinpei, et al.
Pubblicazione: (2025)
di: Guo, Jinpei, et al.
Pubblicazione: (2025)
BiMaCoSR: Binary One-Step Diffusion Model Leveraging Flexible Matrix Compression for Real Super-Resolution
di: Liu, Kai, et al.
Pubblicazione: (2025)
di: Liu, Kai, et al.
Pubblicazione: (2025)
One Diffusion Step to Real-World Super-Resolution via Flow Trajectory Distillation
di: Li, Jianze, et al.
Pubblicazione: (2025)
di: Li, Jianze, et al.
Pubblicazione: (2025)
Quant-dLLM: Post-Training Extreme Low-Bit Quantization for Diffusion Large Language Models
di: Zhang, Tianao, et al.
Pubblicazione: (2025)
di: Zhang, Tianao, et al.
Pubblicazione: (2025)
VEQ: Modality-Adaptive Quantization for MoE Vision-Language Models
di: Qin, Guangshuo, et al.
Pubblicazione: (2026)
di: Qin, Guangshuo, et al.
Pubblicazione: (2026)
CondiQuant: Condition Number Based Low-Bit Quantization for Image Super-Resolution
di: Liu, Kai, et al.
Pubblicazione: (2025)
di: Liu, Kai, et al.
Pubblicazione: (2025)
SOAR: Scale Optimization for Accurate Reconstruction in NVFP4 Quantization
di: Bao, Chengzhu, et al.
Pubblicazione: (2026)
di: Bao, Chengzhu, et al.
Pubblicazione: (2026)
Steering One-Step Diffusion Model with Fidelity-Rich Decoder for Fast Image Compression
di: Chen, Zheng, et al.
Pubblicazione: (2025)
di: Chen, Zheng, et al.
Pubblicazione: (2025)
Intermediate Distillation: Data-Efficient Distillation from Black-Box LLMs for Information Retrieval
di: Li, Zizhong, et al.
Pubblicazione: (2024)
di: Li, Zizhong, et al.
Pubblicazione: (2024)
NEXT: Multi-Grained Mixture of Experts via Text-Modulation for Multi-Modal Object Re-Identification
di: Li, Shihao, et al.
Pubblicazione: (2025)
di: Li, Shihao, et al.
Pubblicazione: (2025)
Flash-DMD: Towards High-Fidelity Few-Step Image Generation with Efficient Distillation and Joint Reinforcement Learning
di: Chen, Guanjie, et al.
Pubblicazione: (2025)
di: Chen, Guanjie, et al.
Pubblicazione: (2025)
MatAnyone: Stable Video Matting with Consistent Memory Propagation
di: Yang, Peiqing, et al.
Pubblicazione: (2025)
di: Yang, Peiqing, et al.
Pubblicazione: (2025)
Fast and Efficient Matching Algorithm with Deadline Instances
di: Song, Zhao, et al.
Pubblicazione: (2023)
di: Song, Zhao, et al.
Pubblicazione: (2023)
Flash-KMeans: Fast and Memory-Efficient Exact K-Means
di: Yang, Shuo, et al.
Pubblicazione: (2026)
di: Yang, Shuo, et al.
Pubblicazione: (2026)
AdaSVD: Adaptive Singular Value Decomposition for Large Language Models
di: Li, Zhiteng, et al.
Pubblicazione: (2025)
di: Li, Zhiteng, et al.
Pubblicazione: (2025)
D$^2$Quant: Accurate Low-bit Post-Training Weight Quantization for LLMs
di: Yan, Xianglong, et al.
Pubblicazione: (2026)
di: Yan, Xianglong, et al.
Pubblicazione: (2026)
Teacher-Feature Drifting: One-Step Diffusion Distillation with Pretrained Diffusion Representations
di: Zhang, Yuan, et al.
Pubblicazione: (2026)
di: Zhang, Yuan, et al.
Pubblicazione: (2026)
Asymmetric VAE for One-Step Video Super-Resolution Acceleration
di: Li, Jianze, et al.
Pubblicazione: (2025)
di: Li, Jianze, et al.
Pubblicazione: (2025)
HiT-SR: Hierarchical Transformer for Efficient Image Super-Resolution
di: Zhang, Xiang, et al.
Pubblicazione: (2024)
di: Zhang, Xiang, et al.
Pubblicazione: (2024)
FlashSampling: Fast and Memory-Efficient Exact Sampling
di: Ruiz, Tomas, et al.
Pubblicazione: (2026)
di: Ruiz, Tomas, et al.
Pubblicazione: (2026)
Fast Selective Flushing to Mitigate Contention-based Cache Timing Attacks
di: Li, Tuo, et al.
Pubblicazione: (2022)
di: Li, Tuo, et al.
Pubblicazione: (2022)
DisCa: Accelerating Video Diffusion Transformers with Distillation-Compatible Learnable Feature Caching
di: Zou, Chang, et al.
Pubblicazione: (2026)
di: Zou, Chang, et al.
Pubblicazione: (2026)
FlashFPS: Efficient Farthest Point Sampling for Large-Scale Point Clouds via Pruning and Caching
di: Fu, Yuzhe, et al.
Pubblicazione: (2026)
di: Fu, Yuzhe, et al.
Pubblicazione: (2026)
BackCache: Mitigating Contention-Based Cache Timing Attacks by Hiding Cache Line Evictions
di: Wang, Quancheng, et al.
Pubblicazione: (2023)
di: Wang, Quancheng, et al.
Pubblicazione: (2023)
BinaryHPE: 3D Human Pose and Shape Estimation via Binarization
di: Li, Zhiteng, et al.
Pubblicazione: (2023)
di: Li, Zhiteng, et al.
Pubblicazione: (2023)
One-Step Diffusion-Based Image Compression with Semantic Distillation
di: Xue, Naifu, et al.
Pubblicazione: (2025)
di: Xue, Naifu, et al.
Pubblicazione: (2025)
One-Step Diffusion Model for Image Motion-Deblurring
di: Liu, Xiaoyang, et al.
Pubblicazione: (2025)
di: Liu, Xiaoyang, et al.
Pubblicazione: (2025)
RIFLE: Removal of Image Flicker-Banding via Latent Diffusion Enhancement
di: Zhu, Libo, et al.
Pubblicazione: (2025)
di: Zhu, Libo, et al.
Pubblicazione: (2025)
FastCache: Fast Caching for Diffusion Transformer Through Learnable Linear Approximation
di: Liu, Dong, et al.
Pubblicazione: (2025)
di: Liu, Dong, et al.
Pubblicazione: (2025)
PT$^2$-LLM: Post-Training Ternarization for Large Language Models
di: Yan, Xianglong, et al.
Pubblicazione: (2025)
di: Yan, Xianglong, et al.
Pubblicazione: (2025)
Linear Image Generation by Synthesizing Exposure Brackets
di: Dai, Yuekun, et al.
Pubblicazione: (2026)
di: Dai, Yuekun, et al.
Pubblicazione: (2026)
DVD-Quant: Data-free Video Diffusion Transformers Quantization
di: Li, Zhiteng, et al.
Pubblicazione: (2025)
di: Li, Zhiteng, et al.
Pubblicazione: (2025)
Attn-JGNN: Attention Enhanced Join-Graph Neural Networks
di: Zhang, Jixin
Pubblicazione: (2025)
di: Zhang, Jixin
Pubblicazione: (2025)
Documenti analoghi
-
FlashEdit: Decoupling Speed, Structure, and Semantics for Precise Image Editing
di: Wu, Junyi, et al.
Pubblicazione: (2025) -
QuantCache: Adaptive Importance-Guided Quantization with Hierarchical Latent and Layer Caching for Video Generation
di: Wu, Junyi, et al.
Pubblicazione: (2025) -
Precise Object and Effect Removal with Adaptive Target-Aware Attention
di: Zhao, Jixin, et al.
Pubblicazione: (2025) -
GHOST: Geometry-Hierarchical Online Streaming Token Eviction for Efficient 3D Reconstruction
di: Chen, Leyang, et al.
Pubblicazione: (2026) -
ReCalKV: Low-Rank KV Cache Compression via Head Reordering and Offline Calibration
di: Yan, Xianglong, et al.
Pubblicazione: (2025)