:: Library Catalog

Buchumschlag

Gespeichert in:

Bibliographische Detailangaben
Hauptverfasser:	Wei, Linye, Chen, Wenjue, Tang, Pingzhi, Guo, Xiaotian, Ye, Le, Wang, Runsheng, Li, Meng
Format:	Preprint
Veröffentlicht:	2025
Schlagworte:	Computation and Language Machine Learning
Online-Zugang:	https://arxiv.org/abs/2511.21759
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Ähnliche Einträge

TEAM: Temporal-Spatial Consistency Guided Expert Activation for MoE Diffusion Language Model Acceleration
von: Wei, Linye, et al.
Veröffentlicht: (2026)

CoreInfer: Accelerating Large Language Model Inference with Semantics-Inspired Adaptive Sparse Activation
von: Wang, Qinsi, et al.
Veröffentlicht: (2024)

Language Models are Symbolic Learners in Arithmetic
von: Deng, Chunyuan, et al.
Veröffentlicht: (2024)

Knowledge is Not Enough: Injecting RL Skills for Continual Adaptation
von: Tang, Pingzhi, et al.
Veröffentlicht: (2026)

Understanding and Accelerating the Training of Masked Diffusion Language Models
von: Hong, Chunsan, et al.
Veröffentlicht: (2026)

Steering Language Models with Weight Arithmetic
von: Fierro, Constanza, et al.
Veröffentlicht: (2025)

Improving Variable-Length Generation in Diffusion Language Models via Length Regularization
von: Cheng, Zicong, et al.
Veröffentlicht: (2026)

LAS: Loss-less ANN-SNN Conversion for Fully Spike-Driven Large Language Models
von: Chen, Long, et al.
Veröffentlicht: (2025)

Attention Sink Forges Native MoE in Attention Layers: Sink-Aware Training to Address Head Collapse
von: Fu, Zizhuo, et al.
Veröffentlicht: (2026)

ORAL: Prompting Your Large-Scale LoRAs via Conditional Recurrent Diffusion
von: Khan, Rana Muhammad Shahroz, et al.
Veröffentlicht: (2025)

Unraveling Arithmetic in Large Language Models: The Role of Algebraic Structures
von: Chang, Fu-Chieh, et al.
Veröffentlicht: (2024)

BiTA: Bi-Directional Tuning for Lossless Acceleration in Large Language Models
von: Lin, Feng, et al.
Veröffentlicht: (2024)

A Dual-Space Framework for General Knowledge Distillation of Large Language Models
von: Zhang, Xue, et al.
Veröffentlicht: (2025)

dLLM-Cache: Accelerating Diffusion Large Language Models with Adaptive Caching
von: Liu, Zhiyuan, et al.
Veröffentlicht: (2025)

Generation Meets Verification: Accelerating Large Language Model Inference with Smart Parallel Auto-Correct Decoding
von: Yi, Hanling, et al.
Veröffentlicht: (2024)

Precise Attribute Intensity Control in Large Language Models via Targeted Representation Editing
von: Zhang, Rongzhi, et al.
Veröffentlicht: (2025)

DPad: Efficient Diffusion Language Models with Suffix Dropout
von: Chen, Xinhua, et al.
Veröffentlicht: (2025)

SpecASR: Accelerating LLM-based Automatic Speech Recognition via Speculative Decoding
von: Wei, Linye, et al.
Veröffentlicht: (2025)

Sink-Aware Pruning for Diffusion Language Models
von: Myrzakhan, Aidar, et al.
Veröffentlicht: (2026)

Language Models Do Hard Arithmetic Tasks Easily and Hardly Do Easy Arithmetic Tasks
von: Gambardella, Andrew, et al.
Veröffentlicht: (2024)

Speculative Diffusion Decoding: Accelerating Language Generation through Diffusion
von: Christopher, Jacob K, et al.
Veröffentlicht: (2024)

MMSciBench: Benchmarking Language Models on Chinese Multimodal Scientific Problems
von: Ye, Xinwu, et al.
Veröffentlicht: (2025)

PortLLM: Personalizing Evolving Large Language Models with Training-Free and Portable Model Patches
von: Khan, Rana Muhammad Shahroz, et al.
Veröffentlicht: (2024)

Diffusion of Thoughts: Chain-of-Thought Reasoning in Diffusion Language Models
von: Ye, Jiacheng, et al.
Veröffentlicht: (2024)

A Survey on Diffusion Language Models
von: Li, Tianyi, et al.
Veröffentlicht: (2025)

Accelerating Diffusion Large Language Models with SlowFast Sampling: The Three Golden Principles
von: Wei, Qingyan, et al.
Veröffentlicht: (2025)

ProPD: Dynamic Token Tree Pruning and Generation for LLM Parallel Decoding
von: Zhong, Shuzhang, et al.
Veröffentlicht: (2024)

OccamLLM: Fast and Exact Language Model Arithmetic in a Single Step
von: Dugan, Owen, et al.
Veröffentlicht: (2024)

MedualTime: A Dual-Adapter Language Model for Medical Time Series-Text Multimodal Learning
von: Ye, Jiexia, et al.
Veröffentlicht: (2024)

DiffLM: Controllable Synthetic Data Generation via Diffusion Language Models
von: Zhou, Ying, et al.
Veröffentlicht: (2024)

Language Models Implement Simple Word2Vec-style Vector Arithmetic
von: Merullo, Jack, et al.
Veröffentlicht: (2023)

Learn while Unlearn: An Iterative Unlearning Framework for Generative Language Models
von: Tang, Haoyu, et al.
Veröffentlicht: (2024)

LLM Unlearning Should Be Form-Independent
von: Ye, Xiaotian, et al.
Veröffentlicht: (2025)

Multimodal Large Language Models for Medicine: A Comprehensive Survey
von: Ye, Jiarui, et al.
Veröffentlicht: (2025)

Large Language Models to Diffusion Finetuning
von: Cetin, Edoardo, et al.
Veröffentlicht: (2025)

SynapseRoute: An Auto-Route Switching Framework on Dual-State Large Language Model
von: Zhang, Wencheng, et al.
Veröffentlicht: (2025)

GPU-Accelerated Synthesis of Mixed-Boolean Arithmetic: Beyond Caching
von: Bathie, Gabriel, et al.
Veröffentlicht: (2026)

Boundary-Guided Policy Optimization for Memory-efficient RL of Diffusion Large Language Models
von: Lin, Nianyi, et al.
Veröffentlicht: (2025)

FAS: Fast ANN-SNN Conversion for Spiking Large Language Models
von: Chen, Long, et al.
Veröffentlicht: (2025)

Reconsidering Positional Supervision in Masked Diffusion Language Model Training
von: Ye, Mengyu, et al.
Veröffentlicht: (2026)