:: Library Catalog

Image de couverture de livre

Enregistré dans:

Détails bibliographiques
Auteurs principaux:	Zhang, Qingjie, Wang, Di, Qian, Haoting, Yan, Liu, Zhang, Tianwei, Xu, Ke, Li, Qi, Huang, Minlie, Li, Hewu, Qiu, Han
Format:	Preprint
Publié:	2025
Sujets:	Computation and Language
Accès en ligne:	https://arxiv.org/abs/2508.17771
Tags:	Ajouter un tag Pas de tags, Soyez le premier à ajouter un tag!

Documents similaires

Understanding the Dark Side of LLMs' Intrinsic Self-Correction
par: Zhang, Qingjie, et autres
Publié: (2024)

Understanding the Dilemma of Unlearning for Large Language Models
par: Zhang, Qingjie, et autres
Publié: (2025)

Stop Before You Fail: Operational Capability Boundaries for Mitigating Unproductive Reasoning in Large Reasoning Models
par: Zhang, Qingjie, et autres
Publié: (2025)

Exploring Multimodal Challenges in Toxic Chinese Detection: Taxonomy, Benchmark, and Findings
par: Yang, Shujian, et autres
Publié: (2025)

An Engorgio Prompt Makes Large Language Model Babble on
par: Dong, Jianshuo, et autres
Publié: (2024)

SafeSearch: Automated Red-Teaming of LLM-Based Search Agents
par: Dong, Jianshuo, et autres
Publié: (2025)

Flatter Tokens are More Valuable for Speculative Draft Model Training
par: Fan, Jiaming, et autres
Publié: (2026)

Speculative Prefill: Turbocharging TTFT with Lightweight and Training-Free Token Importance Estimation
par: Liu, Jingyu, et autres
Publié: (2025)

ShieldLM: Empowering LLMs as Aligned, Customizable and Explainable Safety Detectors
par: Zhang, Zhexin, et autres
Publié: (2024)

Efficient Reasoning for LLMs through Speculative Chain-of-Thought
par: Wang, Jikai, et autres
Publié: (2025)

Accelerating Production LLMs with Combined Token/Embedding Speculators
par: Wertheimer, Davis, et autres
Publié: (2024)

S2D2: Fast Decoding for Diffusion LLMs via Training-Free Self-Speculation
par: Han, Ligong, et autres
Publié: (2026)

ASETF: A Novel Method for Jailbreak Attack on LLMs through Translate Suffix Embeddings
par: Wang, Hao, et autres
Publié: (2024)

Walking in Others' Shoes: How Perspective-Taking Guides Large Language Models in Reducing Toxicity and Bias
par: Xu, Rongwu, et autres
Publié: (2024)

A Case for Application-Aware Space Radiation Tolerance in Orbital Computing
par: Wang, Meiqi, et autres
Publié: (2024)

FlexDraft: Flexible Speculative Decoding via Attention Tuning and Bonus-Guided Calibration
par: Zhang, Yaojie, et autres
Publié: (2026)

When Smiley Turns Hostile: Interpreting How Emojis Trigger LLMs' Toxicity
par: Cui, Shiyao, et autres
Publié: (2025)

Be Careful When Fine-tuning On Open-Source LLMs: Your Fine-tuning Data Could Be Secretly Stolen!
par: Zhang, Zhexin, et autres
Publié: (2025)

LogitSpec: Accelerating Retrieval-based Speculative Decoding via Next Next Token Speculation
par: Liu, Tianyu, et autres
Publié: (2025)

Picky LLMs and Unreliable RMs: An Empirical Study on Safety Alignment after Instruction Tuning
par: Li, Guanlin, et autres
Publié: (2025)

Gumiho: A Hybrid Architecture to Prioritize Early Tokens in Speculative Decoding
par: Li, Jinze, et autres
Publié: (2025)

SpecVLM: Enhancing Speculative Decoding of Video LLMs via Verifier-Guided Token Pruning
par: Ji, Yicheng, et autres
Publié: (2025)

Speculate Deep and Accurate: Lossless and Training-Free Acceleration for Offloaded LLMs via Substitute Speculative Decoding
par: Wang, Pei-Shuo, et autres
Publié: (2025)

DSB: Dynamic Sliding Block Scheduling for Diffusion LLMs
par: Luo, Lizhuo, et autres
Publié: (2026)

COSMIC: Compress Satellite Images Efficiently via Diffusion Compensation
par: Zhang, Ziyuan, et autres
Publié: (2024)

Training-free Dropout Sampling for Semantic Token Acceptance in Speculative Decoding
par: Lee, Jeongtae, et autres
Publié: (2026)

Training Language Model to Critique for Better Refinement
par: Yu, Tianshu, et autres
Publié: (2025)

SpecForge: A Flexible and Efficient Open-Source Training Framework for Speculative Decoding
par: Li, Shenggui, et autres
Publié: (2026)

Language Model Decoding as Direct Metrics Optimization
par: Ji, Haozhe, et autres
Publié: (2023)

Benchmarking Chinese Commonsense Reasoning of LLMs: From Chinese-Specifics to Reasoning-Memorization Correlations
par: Sun, Jiaxing, et autres
Publié: (2024)

Training LLMs Beyond Next Token Prediction -- Filling the Mutual Information Gap
par: Yang, Chun-Hao, et autres
Publié: (2025)

Black-Box Prompt Optimization: Aligning Large Language Models without Model Training
par: Cheng, Jiale, et autres
Publié: (2023)

A Training-Free Length Extrapolation Approach for LLMs: Greedy Attention Logit Interpolation (GALI)
par: Li, Yan, et autres
Publié: (2025)

The Earth is Flat because...: Investigating LLMs' Belief towards Misinformation via Persuasive Conversation
par: Xu, Rongwu, et autres
Publié: (2023)

LLM-based Privacy Data Augmentation Guided by Knowledge Distillation with a Distribution Tutor for Medical Text Classification
par: Song, Yiping, et autres
Publié: (2024)

Unlocking Full Efficiency of Token Filtering in Large Language Model Training
par: Chai, Di, et autres
Publié: (2025)

Defending Large Language Models Against Jailbreaking Attacks Through Goal Prioritization
par: Zhang, Zhexin, et autres
Publié: (2023)

Tutorial Proposal: Speculative Decoding for Efficient LLM Inference
par: Xia, Heming, et autres
Publié: (2025)

GRIFFIN: Effective Token Alignment for Faster Speculative Decoding
par: Hu, Shijing, et autres
Publié: (2025)

STS: Efficient Sparse Attention with Speculative Token Sparsity
par: Xu, Ceyu, et autres
Publié: (2026)