Salvato in:
| Autori principali: | Zhou, Ziqi, Yang, Peng, Liang, Yuxin, Liu, Mingliu, Lu, Jia |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2026
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2605.08835 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
AsyncDiff: Parallelizing Diffusion Models by Asynchronous Denoising
di: Chen, Zigeng, et al.
Pubblicazione: (2024)
di: Chen, Zigeng, et al.
Pubblicazione: (2024)
Flash Communication: Reducing Tensor Parallelization Bottleneck for Fast Large Language Model Inference
di: Li, Qingyuan, et al.
Pubblicazione: (2024)
di: Li, Qingyuan, et al.
Pubblicazione: (2024)
DiffAgent: Fast and Accurate Text-to-Image API Selection with Large Language Model
di: Zhao, Lirui, et al.
Pubblicazione: (2024)
di: Zhao, Lirui, et al.
Pubblicazione: (2024)
BatchLLM: Optimizing Large Batched LLM Inference with Global Prefix Sharing and Throughput-oriented Token Batching
di: Zheng, Zhen, et al.
Pubblicazione: (2024)
di: Zheng, Zhen, et al.
Pubblicazione: (2024)
BlockBatch: Multi-Scale Consensus Decoding for Efficient Diffusion Language Model Inference
di: Wu, Xiaoyou, et al.
Pubblicazione: (2026)
di: Wu, Xiaoyou, et al.
Pubblicazione: (2026)
AdaDiff: Adaptive Step Selection for Fast Diffusion Models
di: Zhang, Hui, et al.
Pubblicazione: (2023)
di: Zhang, Hui, et al.
Pubblicazione: (2023)
DiffScale: Continuous Downscaling and Bias Correction of Subseasonal Wind Speed Forecasts using Diffusion Models
di: Springenberg, Maximilian, et al.
Pubblicazione: (2025)
di: Springenberg, Maximilian, et al.
Pubblicazione: (2025)
DiffGRM: Diffusion-based Generative Recommendation Model
di: Liu, Zhao, et al.
Pubblicazione: (2025)
di: Liu, Zhao, et al.
Pubblicazione: (2025)
FairBatching: Fairness-Aware Batch Formation for LLM Inference
di: Lyu, Hongtao, et al.
Pubblicazione: (2025)
di: Lyu, Hongtao, et al.
Pubblicazione: (2025)
DiffCAP: Diffusion-based Cumulative Adversarial Purification for Vision Language Models
di: Fu, Jia, et al.
Pubblicazione: (2025)
di: Fu, Jia, et al.
Pubblicazione: (2025)
DiffLoad: Uncertainty Quantification in Electrical Load Forecasting with the Diffusion Model
di: Wang, Zhixian, et al.
Pubblicazione: (2023)
di: Wang, Zhixian, et al.
Pubblicazione: (2023)
AnimateDiff-Lightning: Cross-Model Diffusion Distillation
di: Lin, Shanchuan, et al.
Pubblicazione: (2024)
di: Lin, Shanchuan, et al.
Pubblicazione: (2024)
Diff-PIC: Revolutionizing Particle-In-Cell Nuclear Fusion Simulation with Diffusion Models
di: Liu, Chuan, et al.
Pubblicazione: (2024)
di: Liu, Chuan, et al.
Pubblicazione: (2024)
Threshold-Based Exclusive Batching for LLM Inference
di: Zhang, Weifang, et al.
Pubblicazione: (2026)
di: Zhang, Weifang, et al.
Pubblicazione: (2026)
Stage-Diff: Stage-wise Long-Term Time Series Generation Based on Diffusion Models
di: Hou, Xuan, et al.
Pubblicazione: (2025)
di: Hou, Xuan, et al.
Pubblicazione: (2025)
DisCo-Diff: Enhancing Continuous Diffusion Models with Discrete Latents
di: Xu, Yilun, et al.
Pubblicazione: (2024)
di: Xu, Yilun, et al.
Pubblicazione: (2024)
EPIC: Efficient and Parallel Inference under CFG Constraints for Diffusion Language Models
di: Jin, Hyundong, et al.
Pubblicazione: (2026)
di: Jin, Hyundong, et al.
Pubblicazione: (2026)
PerturbDiff: Functional Diffusion for Single-Cell Perturbation Modeling
di: Yuan, Xinyu, et al.
Pubblicazione: (2026)
di: Yuan, Xinyu, et al.
Pubblicazione: (2026)
Fast On-device LLM Inference with NPUs
di: Xu, Daliang, et al.
Pubblicazione: (2024)
di: Xu, Daliang, et al.
Pubblicazione: (2024)
RealignDiff: Boosting Text-to-Image Diffusion Model with Coarse-to-fine Semantic Re-alignment
di: Jiang, Zutao, et al.
Pubblicazione: (2023)
di: Jiang, Zutao, et al.
Pubblicazione: (2023)
Resource-Efficient Generative AI Model Deployment in Mobile Edge Networks
di: Liang, Yuxin, et al.
Pubblicazione: (2024)
di: Liang, Yuxin, et al.
Pubblicazione: (2024)
DiffSpectra: Molecular Structure Elucidation from Spectra using Diffusion Models
di: Wang, Liang, et al.
Pubblicazione: (2025)
di: Wang, Liang, et al.
Pubblicazione: (2025)
Fast Inference for Augmented Large Language Models
di: Shahout, Rana, et al.
Pubblicazione: (2024)
di: Shahout, Rana, et al.
Pubblicazione: (2024)
Why Diffusion Language Models Struggle with Truly Parallel (Non-Autoregressive) Decoding?
di: Li, Pengxiang, et al.
Pubblicazione: (2026)
di: Li, Pengxiang, et al.
Pubblicazione: (2026)
Iterative Learning Control-Informed Reinforcement Learning for Batch Process Control
di: Lin, Runze, et al.
Pubblicazione: (2026)
di: Lin, Runze, et al.
Pubblicazione: (2026)
SimDiff: Simpler Yet Better Diffusion Model for Time Series Point Forecasting
di: Ding, Hang, et al.
Pubblicazione: (2025)
di: Ding, Hang, et al.
Pubblicazione: (2025)
DepCap: Adaptive Block-Wise Parallel Decoding for Efficient Diffusion LM Inference
di: Xia, Xiang, et al.
Pubblicazione: (2026)
di: Xia, Xiang, et al.
Pubblicazione: (2026)
LocDiff: Identifying Locations on Earth by Diffusing in the Hilbert Space
di: Wang, Zhangyu, et al.
Pubblicazione: (2025)
di: Wang, Zhangyu, et al.
Pubblicazione: (2025)
Edge Intelligence Optimization for Large Language Model Inference with Batching and Quantization
di: Zhang, Xinyuan, et al.
Pubblicazione: (2024)
di: Zhang, Xinyuan, et al.
Pubblicazione: (2024)
MacDiff: Unified Skeleton Modeling with Masked Conditional Diffusion
di: Wu, Lehong, et al.
Pubblicazione: (2024)
di: Wu, Lehong, et al.
Pubblicazione: (2024)
AnchorDiff: Topology-Aware Masked Diffusion with Confidence-based Rewriting for Radiology Report Generation
di: Yu, Shiying, et al.
Pubblicazione: (2026)
di: Yu, Shiying, et al.
Pubblicazione: (2026)
DiffGraph: Heterogeneous Graph Diffusion Model
di: Li, Zongwei, et al.
Pubblicazione: (2025)
di: Li, Zongwei, et al.
Pubblicazione: (2025)
DiffMoE: Dynamic Token Selection for Scalable Diffusion Transformers
di: Shi, Minglei, et al.
Pubblicazione: (2025)
di: Shi, Minglei, et al.
Pubblicazione: (2025)
MineDraft: A Framework for Batch Parallel Speculative Decoding
di: Tang, Zhenwei, et al.
Pubblicazione: (2026)
di: Tang, Zhenwei, et al.
Pubblicazione: (2026)
Phys-Diff: A Physics-Inspired Latent Diffusion Model for Tropical Cyclone Forecasting
di: Liu, Lei, et al.
Pubblicazione: (2026)
di: Liu, Lei, et al.
Pubblicazione: (2026)
DiffCSS: Diverse and Expressive Conversational Speech Synthesis with Diffusion Models
di: wu, Weihao, et al.
Pubblicazione: (2025)
di: wu, Weihao, et al.
Pubblicazione: (2025)
DiffDecompose: Layer-Wise Decomposition of Alpha-Composited Images via Diffusion Transformers
di: Wang, Zitong, et al.
Pubblicazione: (2025)
di: Wang, Zitong, et al.
Pubblicazione: (2025)
RecDiff: Diffusion Model for Social Recommendation
di: Li, Zongwei, et al.
Pubblicazione: (2024)
di: Li, Zongwei, et al.
Pubblicazione: (2024)
Fast Monte Carlo Tree Diffusion: 100x Speedup via Parallel Sparse Planning
di: Yoon, Jaesik, et al.
Pubblicazione: (2025)
di: Yoon, Jaesik, et al.
Pubblicazione: (2025)
DiffETM: Diffusion Process Enhanced Embedded Topic Model
di: Shao, Wei, et al.
Pubblicazione: (2025)
di: Shao, Wei, et al.
Pubblicazione: (2025)
Documenti analoghi
-
AsyncDiff: Parallelizing Diffusion Models by Asynchronous Denoising
di: Chen, Zigeng, et al.
Pubblicazione: (2024) -
Flash Communication: Reducing Tensor Parallelization Bottleneck for Fast Large Language Model Inference
di: Li, Qingyuan, et al.
Pubblicazione: (2024) -
DiffAgent: Fast and Accurate Text-to-Image API Selection with Large Language Model
di: Zhao, Lirui, et al.
Pubblicazione: (2024) -
BatchLLM: Optimizing Large Batched LLM Inference with Global Prefix Sharing and Throughput-oriented Token Batching
di: Zheng, Zhen, et al.
Pubblicazione: (2024) -
BlockBatch: Multi-Scale Consensus Decoding for Efficient Diffusion Language Model Inference
di: Wu, Xiaoyou, et al.
Pubblicazione: (2026)