Enregistré dans:
| Auteurs principaux: | Zhang, Qingjie, Wang, Di, Qian, Haoting, Yan, Liu, Zhang, Tianwei, Xu, Ke, Li, Qi, Huang, Minlie, Li, Hewu, Qiu, Han |
|---|---|
| Format: | Preprint |
| Publié: |
2025
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2508.17771 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
Understanding the Dark Side of LLMs' Intrinsic Self-Correction
par: Zhang, Qingjie, et autres
Publié: (2024)
par: Zhang, Qingjie, et autres
Publié: (2024)
Understanding the Dilemma of Unlearning for Large Language Models
par: Zhang, Qingjie, et autres
Publié: (2025)
par: Zhang, Qingjie, et autres
Publié: (2025)
Stop Before You Fail: Operational Capability Boundaries for Mitigating Unproductive Reasoning in Large Reasoning Models
par: Zhang, Qingjie, et autres
Publié: (2025)
par: Zhang, Qingjie, et autres
Publié: (2025)
Exploring Multimodal Challenges in Toxic Chinese Detection: Taxonomy, Benchmark, and Findings
par: Yang, Shujian, et autres
Publié: (2025)
par: Yang, Shujian, et autres
Publié: (2025)
An Engorgio Prompt Makes Large Language Model Babble on
par: Dong, Jianshuo, et autres
Publié: (2024)
par: Dong, Jianshuo, et autres
Publié: (2024)
SafeSearch: Automated Red-Teaming of LLM-Based Search Agents
par: Dong, Jianshuo, et autres
Publié: (2025)
par: Dong, Jianshuo, et autres
Publié: (2025)
Flatter Tokens are More Valuable for Speculative Draft Model Training
par: Fan, Jiaming, et autres
Publié: (2026)
par: Fan, Jiaming, et autres
Publié: (2026)
Speculative Prefill: Turbocharging TTFT with Lightweight and Training-Free Token Importance Estimation
par: Liu, Jingyu, et autres
Publié: (2025)
par: Liu, Jingyu, et autres
Publié: (2025)
ShieldLM: Empowering LLMs as Aligned, Customizable and Explainable Safety Detectors
par: Zhang, Zhexin, et autres
Publié: (2024)
par: Zhang, Zhexin, et autres
Publié: (2024)
Efficient Reasoning for LLMs through Speculative Chain-of-Thought
par: Wang, Jikai, et autres
Publié: (2025)
par: Wang, Jikai, et autres
Publié: (2025)
Accelerating Production LLMs with Combined Token/Embedding Speculators
par: Wertheimer, Davis, et autres
Publié: (2024)
par: Wertheimer, Davis, et autres
Publié: (2024)
S2D2: Fast Decoding for Diffusion LLMs via Training-Free Self-Speculation
par: Han, Ligong, et autres
Publié: (2026)
par: Han, Ligong, et autres
Publié: (2026)
ASETF: A Novel Method for Jailbreak Attack on LLMs through Translate Suffix Embeddings
par: Wang, Hao, et autres
Publié: (2024)
par: Wang, Hao, et autres
Publié: (2024)
Walking in Others' Shoes: How Perspective-Taking Guides Large Language Models in Reducing Toxicity and Bias
par: Xu, Rongwu, et autres
Publié: (2024)
par: Xu, Rongwu, et autres
Publié: (2024)
A Case for Application-Aware Space Radiation Tolerance in Orbital Computing
par: Wang, Meiqi, et autres
Publié: (2024)
par: Wang, Meiqi, et autres
Publié: (2024)
FlexDraft: Flexible Speculative Decoding via Attention Tuning and Bonus-Guided Calibration
par: Zhang, Yaojie, et autres
Publié: (2026)
par: Zhang, Yaojie, et autres
Publié: (2026)
When Smiley Turns Hostile: Interpreting How Emojis Trigger LLMs' Toxicity
par: Cui, Shiyao, et autres
Publié: (2025)
par: Cui, Shiyao, et autres
Publié: (2025)
Be Careful When Fine-tuning On Open-Source LLMs: Your Fine-tuning Data Could Be Secretly Stolen!
par: Zhang, Zhexin, et autres
Publié: (2025)
par: Zhang, Zhexin, et autres
Publié: (2025)
LogitSpec: Accelerating Retrieval-based Speculative Decoding via Next Next Token Speculation
par: Liu, Tianyu, et autres
Publié: (2025)
par: Liu, Tianyu, et autres
Publié: (2025)
Picky LLMs and Unreliable RMs: An Empirical Study on Safety Alignment after Instruction Tuning
par: Li, Guanlin, et autres
Publié: (2025)
par: Li, Guanlin, et autres
Publié: (2025)
Gumiho: A Hybrid Architecture to Prioritize Early Tokens in Speculative Decoding
par: Li, Jinze, et autres
Publié: (2025)
par: Li, Jinze, et autres
Publié: (2025)
SpecVLM: Enhancing Speculative Decoding of Video LLMs via Verifier-Guided Token Pruning
par: Ji, Yicheng, et autres
Publié: (2025)
par: Ji, Yicheng, et autres
Publié: (2025)
Speculate Deep and Accurate: Lossless and Training-Free Acceleration for Offloaded LLMs via Substitute Speculative Decoding
par: Wang, Pei-Shuo, et autres
Publié: (2025)
par: Wang, Pei-Shuo, et autres
Publié: (2025)
DSB: Dynamic Sliding Block Scheduling for Diffusion LLMs
par: Luo, Lizhuo, et autres
Publié: (2026)
par: Luo, Lizhuo, et autres
Publié: (2026)
COSMIC: Compress Satellite Images Efficiently via Diffusion Compensation
par: Zhang, Ziyuan, et autres
Publié: (2024)
par: Zhang, Ziyuan, et autres
Publié: (2024)
Training-free Dropout Sampling for Semantic Token Acceptance in Speculative Decoding
par: Lee, Jeongtae, et autres
Publié: (2026)
par: Lee, Jeongtae, et autres
Publié: (2026)
Training Language Model to Critique for Better Refinement
par: Yu, Tianshu, et autres
Publié: (2025)
par: Yu, Tianshu, et autres
Publié: (2025)
SpecForge: A Flexible and Efficient Open-Source Training Framework for Speculative Decoding
par: Li, Shenggui, et autres
Publié: (2026)
par: Li, Shenggui, et autres
Publié: (2026)
Language Model Decoding as Direct Metrics Optimization
par: Ji, Haozhe, et autres
Publié: (2023)
par: Ji, Haozhe, et autres
Publié: (2023)
Benchmarking Chinese Commonsense Reasoning of LLMs: From Chinese-Specifics to Reasoning-Memorization Correlations
par: Sun, Jiaxing, et autres
Publié: (2024)
par: Sun, Jiaxing, et autres
Publié: (2024)
Training LLMs Beyond Next Token Prediction -- Filling the Mutual Information Gap
par: Yang, Chun-Hao, et autres
Publié: (2025)
par: Yang, Chun-Hao, et autres
Publié: (2025)
Black-Box Prompt Optimization: Aligning Large Language Models without Model Training
par: Cheng, Jiale, et autres
Publié: (2023)
par: Cheng, Jiale, et autres
Publié: (2023)
A Training-Free Length Extrapolation Approach for LLMs: Greedy Attention Logit Interpolation (GALI)
par: Li, Yan, et autres
Publié: (2025)
par: Li, Yan, et autres
Publié: (2025)
The Earth is Flat because...: Investigating LLMs' Belief towards Misinformation via Persuasive Conversation
par: Xu, Rongwu, et autres
Publié: (2023)
par: Xu, Rongwu, et autres
Publié: (2023)
LLM-based Privacy Data Augmentation Guided by Knowledge Distillation with a Distribution Tutor for Medical Text Classification
par: Song, Yiping, et autres
Publié: (2024)
par: Song, Yiping, et autres
Publié: (2024)
Unlocking Full Efficiency of Token Filtering in Large Language Model Training
par: Chai, Di, et autres
Publié: (2025)
par: Chai, Di, et autres
Publié: (2025)
Defending Large Language Models Against Jailbreaking Attacks Through Goal Prioritization
par: Zhang, Zhexin, et autres
Publié: (2023)
par: Zhang, Zhexin, et autres
Publié: (2023)
Tutorial Proposal: Speculative Decoding for Efficient LLM Inference
par: Xia, Heming, et autres
Publié: (2025)
par: Xia, Heming, et autres
Publié: (2025)
GRIFFIN: Effective Token Alignment for Faster Speculative Decoding
par: Hu, Shijing, et autres
Publié: (2025)
par: Hu, Shijing, et autres
Publié: (2025)
STS: Efficient Sparse Attention with Speculative Token Sparsity
par: Xu, Ceyu, et autres
Publié: (2026)
par: Xu, Ceyu, et autres
Publié: (2026)
Documents similaires
-
Understanding the Dark Side of LLMs' Intrinsic Self-Correction
par: Zhang, Qingjie, et autres
Publié: (2024) -
Understanding the Dilemma of Unlearning for Large Language Models
par: Zhang, Qingjie, et autres
Publié: (2025) -
Stop Before You Fail: Operational Capability Boundaries for Mitigating Unproductive Reasoning in Large Reasoning Models
par: Zhang, Qingjie, et autres
Publié: (2025) -
Exploring Multimodal Challenges in Toxic Chinese Detection: Taxonomy, Benchmark, and Findings
par: Yang, Shujian, et autres
Publié: (2025) -
An Engorgio Prompt Makes Large Language Model Babble on
par: Dong, Jianshuo, et autres
Publié: (2024)