Gespeichert in:
| Hauptverfasser: | Wei, Linye, Chen, Wenjue, Tang, Pingzhi, Guo, Xiaotian, Ye, Le, Wang, Runsheng, Li, Meng |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2025
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2511.21759 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
TEAM: Temporal-Spatial Consistency Guided Expert Activation for MoE Diffusion Language Model Acceleration
von: Wei, Linye, et al.
Veröffentlicht: (2026)
von: Wei, Linye, et al.
Veröffentlicht: (2026)
CoreInfer: Accelerating Large Language Model Inference with Semantics-Inspired Adaptive Sparse Activation
von: Wang, Qinsi, et al.
Veröffentlicht: (2024)
von: Wang, Qinsi, et al.
Veröffentlicht: (2024)
Language Models are Symbolic Learners in Arithmetic
von: Deng, Chunyuan, et al.
Veröffentlicht: (2024)
von: Deng, Chunyuan, et al.
Veröffentlicht: (2024)
Knowledge is Not Enough: Injecting RL Skills for Continual Adaptation
von: Tang, Pingzhi, et al.
Veröffentlicht: (2026)
von: Tang, Pingzhi, et al.
Veröffentlicht: (2026)
Understanding and Accelerating the Training of Masked Diffusion Language Models
von: Hong, Chunsan, et al.
Veröffentlicht: (2026)
von: Hong, Chunsan, et al.
Veröffentlicht: (2026)
Steering Language Models with Weight Arithmetic
von: Fierro, Constanza, et al.
Veröffentlicht: (2025)
von: Fierro, Constanza, et al.
Veröffentlicht: (2025)
Improving Variable-Length Generation in Diffusion Language Models via Length Regularization
von: Cheng, Zicong, et al.
Veröffentlicht: (2026)
von: Cheng, Zicong, et al.
Veröffentlicht: (2026)
LAS: Loss-less ANN-SNN Conversion for Fully Spike-Driven Large Language Models
von: Chen, Long, et al.
Veröffentlicht: (2025)
von: Chen, Long, et al.
Veröffentlicht: (2025)
Attention Sink Forges Native MoE in Attention Layers: Sink-Aware Training to Address Head Collapse
von: Fu, Zizhuo, et al.
Veröffentlicht: (2026)
von: Fu, Zizhuo, et al.
Veröffentlicht: (2026)
ORAL: Prompting Your Large-Scale LoRAs via Conditional Recurrent Diffusion
von: Khan, Rana Muhammad Shahroz, et al.
Veröffentlicht: (2025)
von: Khan, Rana Muhammad Shahroz, et al.
Veröffentlicht: (2025)
Unraveling Arithmetic in Large Language Models: The Role of Algebraic Structures
von: Chang, Fu-Chieh, et al.
Veröffentlicht: (2024)
von: Chang, Fu-Chieh, et al.
Veröffentlicht: (2024)
BiTA: Bi-Directional Tuning for Lossless Acceleration in Large Language Models
von: Lin, Feng, et al.
Veröffentlicht: (2024)
von: Lin, Feng, et al.
Veröffentlicht: (2024)
A Dual-Space Framework for General Knowledge Distillation of Large Language Models
von: Zhang, Xue, et al.
Veröffentlicht: (2025)
von: Zhang, Xue, et al.
Veröffentlicht: (2025)
dLLM-Cache: Accelerating Diffusion Large Language Models with Adaptive Caching
von: Liu, Zhiyuan, et al.
Veröffentlicht: (2025)
von: Liu, Zhiyuan, et al.
Veröffentlicht: (2025)
Generation Meets Verification: Accelerating Large Language Model Inference with Smart Parallel Auto-Correct Decoding
von: Yi, Hanling, et al.
Veröffentlicht: (2024)
von: Yi, Hanling, et al.
Veröffentlicht: (2024)
Precise Attribute Intensity Control in Large Language Models via Targeted Representation Editing
von: Zhang, Rongzhi, et al.
Veröffentlicht: (2025)
von: Zhang, Rongzhi, et al.
Veröffentlicht: (2025)
DPad: Efficient Diffusion Language Models with Suffix Dropout
von: Chen, Xinhua, et al.
Veröffentlicht: (2025)
von: Chen, Xinhua, et al.
Veröffentlicht: (2025)
SpecASR: Accelerating LLM-based Automatic Speech Recognition via Speculative Decoding
von: Wei, Linye, et al.
Veröffentlicht: (2025)
von: Wei, Linye, et al.
Veröffentlicht: (2025)
Sink-Aware Pruning for Diffusion Language Models
von: Myrzakhan, Aidar, et al.
Veröffentlicht: (2026)
von: Myrzakhan, Aidar, et al.
Veröffentlicht: (2026)
Language Models Do Hard Arithmetic Tasks Easily and Hardly Do Easy Arithmetic Tasks
von: Gambardella, Andrew, et al.
Veröffentlicht: (2024)
von: Gambardella, Andrew, et al.
Veröffentlicht: (2024)
Speculative Diffusion Decoding: Accelerating Language Generation through Diffusion
von: Christopher, Jacob K, et al.
Veröffentlicht: (2024)
von: Christopher, Jacob K, et al.
Veröffentlicht: (2024)
MMSciBench: Benchmarking Language Models on Chinese Multimodal Scientific Problems
von: Ye, Xinwu, et al.
Veröffentlicht: (2025)
von: Ye, Xinwu, et al.
Veröffentlicht: (2025)
PortLLM: Personalizing Evolving Large Language Models with Training-Free and Portable Model Patches
von: Khan, Rana Muhammad Shahroz, et al.
Veröffentlicht: (2024)
von: Khan, Rana Muhammad Shahroz, et al.
Veröffentlicht: (2024)
Diffusion of Thoughts: Chain-of-Thought Reasoning in Diffusion Language Models
von: Ye, Jiacheng, et al.
Veröffentlicht: (2024)
von: Ye, Jiacheng, et al.
Veröffentlicht: (2024)
A Survey on Diffusion Language Models
von: Li, Tianyi, et al.
Veröffentlicht: (2025)
von: Li, Tianyi, et al.
Veröffentlicht: (2025)
Accelerating Diffusion Large Language Models with SlowFast Sampling: The Three Golden Principles
von: Wei, Qingyan, et al.
Veröffentlicht: (2025)
von: Wei, Qingyan, et al.
Veröffentlicht: (2025)
ProPD: Dynamic Token Tree Pruning and Generation for LLM Parallel Decoding
von: Zhong, Shuzhang, et al.
Veröffentlicht: (2024)
von: Zhong, Shuzhang, et al.
Veröffentlicht: (2024)
OccamLLM: Fast and Exact Language Model Arithmetic in a Single Step
von: Dugan, Owen, et al.
Veröffentlicht: (2024)
von: Dugan, Owen, et al.
Veröffentlicht: (2024)
MedualTime: A Dual-Adapter Language Model for Medical Time Series-Text Multimodal Learning
von: Ye, Jiexia, et al.
Veröffentlicht: (2024)
von: Ye, Jiexia, et al.
Veröffentlicht: (2024)
DiffLM: Controllable Synthetic Data Generation via Diffusion Language Models
von: Zhou, Ying, et al.
Veröffentlicht: (2024)
von: Zhou, Ying, et al.
Veröffentlicht: (2024)
Language Models Implement Simple Word2Vec-style Vector Arithmetic
von: Merullo, Jack, et al.
Veröffentlicht: (2023)
von: Merullo, Jack, et al.
Veröffentlicht: (2023)
Learn while Unlearn: An Iterative Unlearning Framework for Generative Language Models
von: Tang, Haoyu, et al.
Veröffentlicht: (2024)
von: Tang, Haoyu, et al.
Veröffentlicht: (2024)
LLM Unlearning Should Be Form-Independent
von: Ye, Xiaotian, et al.
Veröffentlicht: (2025)
von: Ye, Xiaotian, et al.
Veröffentlicht: (2025)
Multimodal Large Language Models for Medicine: A Comprehensive Survey
von: Ye, Jiarui, et al.
Veröffentlicht: (2025)
von: Ye, Jiarui, et al.
Veröffentlicht: (2025)
Large Language Models to Diffusion Finetuning
von: Cetin, Edoardo, et al.
Veröffentlicht: (2025)
von: Cetin, Edoardo, et al.
Veröffentlicht: (2025)
SynapseRoute: An Auto-Route Switching Framework on Dual-State Large Language Model
von: Zhang, Wencheng, et al.
Veröffentlicht: (2025)
von: Zhang, Wencheng, et al.
Veröffentlicht: (2025)
GPU-Accelerated Synthesis of Mixed-Boolean Arithmetic: Beyond Caching
von: Bathie, Gabriel, et al.
Veröffentlicht: (2026)
von: Bathie, Gabriel, et al.
Veröffentlicht: (2026)
Boundary-Guided Policy Optimization for Memory-efficient RL of Diffusion Large Language Models
von: Lin, Nianyi, et al.
Veröffentlicht: (2025)
von: Lin, Nianyi, et al.
Veröffentlicht: (2025)
FAS: Fast ANN-SNN Conversion for Spiking Large Language Models
von: Chen, Long, et al.
Veröffentlicht: (2025)
von: Chen, Long, et al.
Veröffentlicht: (2025)
Reconsidering Positional Supervision in Masked Diffusion Language Model Training
von: Ye, Mengyu, et al.
Veröffentlicht: (2026)
von: Ye, Mengyu, et al.
Veröffentlicht: (2026)
Ähnliche Einträge
-
TEAM: Temporal-Spatial Consistency Guided Expert Activation for MoE Diffusion Language Model Acceleration
von: Wei, Linye, et al.
Veröffentlicht: (2026) -
CoreInfer: Accelerating Large Language Model Inference with Semantics-Inspired Adaptive Sparse Activation
von: Wang, Qinsi, et al.
Veröffentlicht: (2024) -
Language Models are Symbolic Learners in Arithmetic
von: Deng, Chunyuan, et al.
Veröffentlicht: (2024) -
Knowledge is Not Enough: Injecting RL Skills for Continual Adaptation
von: Tang, Pingzhi, et al.
Veröffentlicht: (2026) -
Understanding and Accelerating the Training of Masked Diffusion Language Models
von: Hong, Chunsan, et al.
Veröffentlicht: (2026)