Enregistré dans:
| Auteurs principaux: | Wu, Ning, Liu, Rui, Lin, Xinkun, Chen, Weixing, Xiang, Jinxi, Wei, Tao, Yao, Lina, Li, Mingjie |
|---|---|
| Format: | Preprint |
| Publié: |
2026
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2605.27194 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
Not All Tokens and Heads Are Equally Important: Dual-Level Attention Intervention for Hallucination Mitigation
par: Tang, Lexiang, et autres
Publié: (2025)
par: Tang, Lexiang, et autres
Publié: (2025)
Image Tokens Matter: Mitigating Hallucination in Discrete Tokenizer-based Large Vision-Language Models via Latent Editing
par: Wang, Weixing, et autres
Publié: (2025)
par: Wang, Weixing, et autres
Publié: (2025)
SimCT: Recovering Lost Supervision for Cross-Tokenizer On-Policy Distillation
par: Sun, Jie, et autres
Publié: (2026)
par: Sun, Jie, et autres
Publié: (2026)
VQ-Seg: Vector-Quantized Token Perturbation for Semi-Supervised Medical Image Segmentation
par: Yang, Sicheng, et autres
Publié: (2026)
par: Yang, Sicheng, et autres
Publié: (2026)
Not All Data Are Unlearned Equally
par: Krishnan, Aravind, et autres
Publié: (2025)
par: Krishnan, Aravind, et autres
Publié: (2025)
Token-based Decision Criteria Are Suboptimal in In-context Learning
par: Cho, Hakaze, et autres
Publié: (2024)
par: Cho, Hakaze, et autres
Publié: (2024)
DART: Differentiable Dynamic Adaptive Region Tokenizer for Vision Foundation Models
par: Yin, Shicheng, et autres
Publié: (2025)
par: Yin, Shicheng, et autres
Publié: (2025)
Not All Samples Should Be Utilized Equally: Towards Understanding and Improving Dataset Distillation
par: Wang, Shaobo, et autres
Publié: (2024)
par: Wang, Shaobo, et autres
Publié: (2024)
Not All Tokens Matter: Towards Efficient LLM Reasoning via Token Significance in Reinforcement Learning
par: Liu, Hanbing, et autres
Publié: (2025)
par: Liu, Hanbing, et autres
Publié: (2025)
Video Token Merging for Long-form Video Understanding
par: Lee, Seon-Ho, et autres
Publié: (2024)
par: Lee, Seon-Ho, et autres
Publié: (2024)
LongAttn: Selecting Long-context Training Data via Token-level Attention
par: Wu, Longyun, et autres
Publié: (2025)
par: Wu, Longyun, et autres
Publié: (2025)
Weighting What Matters: Boosting Sample Efficiency in Medical Report Generation via Token Reweighting
par: Weers, Alexander, et autres
Publié: (2026)
par: Weers, Alexander, et autres
Publié: (2026)
Homogeneous Tokenizer Matters: Homogeneous Visual Tokenizer for Remote Sensing Image Understanding
par: Shao, Run, et autres
Publié: (2024)
par: Shao, Run, et autres
Publié: (2024)
Token Distillation: Attention-aware Input Embeddings For New Tokens
par: Dobler, Konstantin, et autres
Publié: (2025)
par: Dobler, Konstantin, et autres
Publié: (2025)
X-Token: Projection-Guided Cross-Tokenizer Knowledge Distillation
par: Sreenivas, Sharath Turuvekere, et autres
Publié: (2026)
par: Sreenivas, Sharath Turuvekere, et autres
Publié: (2026)
Enhancing Cross-Tokenizer Knowledge Distillation with Contextual Dynamical Mapping
par: Chen, Yijie, et autres
Publié: (2025)
par: Chen, Yijie, et autres
Publié: (2025)
Vector Arithmetic in Concept and Token Subspaces
par: Feucht, Sheridan, et autres
Publié: (2025)
par: Feucht, Sheridan, et autres
Publié: (2025)
EGAD: Entropy-Guided Adaptive Distillation for Token-Level Knowledge Transfer
par: Zhang, Hao, et autres
Publié: (2026)
par: Zhang, Hao, et autres
Publié: (2026)
All for One: LLMs Solve Mental Math at the Last Token With Information Transferred From Other Tokens
par: Mamidanna, Siddarth, et autres
Publié: (2025)
par: Mamidanna, Siddarth, et autres
Publié: (2025)
Beyond Next-Token Alignment: Distilling Multimodal Large Language Models via Token Interactions
par: Chen, Lin, et autres
Publié: (2026)
par: Chen, Lin, et autres
Publié: (2026)
TokenCompose: Text-to-Image Diffusion with Token-level Supervision
par: Wang, Zirui, et autres
Publié: (2023)
par: Wang, Zirui, et autres
Publié: (2023)
Rethinking the Role of Token Retrieval in Multi-Vector Retrieval
par: Lee, Jinhyuk, et autres
Publié: (2023)
par: Lee, Jinhyuk, et autres
Publié: (2023)
CTPD: Cross Tokenizer Preference Distillation
par: Nguyen, Truong, et autres
Publié: (2026)
par: Nguyen, Truong, et autres
Publié: (2026)
AdaptToken: Entropy-based Adaptive Token Selection for MLLM Long Video Understanding
par: Qi, Haozhe, et autres
Publié: (2026)
par: Qi, Haozhe, et autres
Publié: (2026)
Learning to Focus: Causal Attention Distillation via Gradient-Guided Token Pruning
par: Guo, Yiju, et autres
Publié: (2025)
par: Guo, Yiju, et autres
Publié: (2025)
StrokeNUWA: Tokenizing Strokes for Vector Graphic Synthesis
par: Tang, Zecheng, et autres
Publié: (2024)
par: Tang, Zecheng, et autres
Publié: (2024)
Tokenization Matters! Degrading Large Language Models through Challenging Their Tokenization
par: Wang, Dixuan, et autres
Publié: (2024)
par: Wang, Dixuan, et autres
Publié: (2024)
Saliency-driven Dynamic Token Pruning for Large Language Models
par: Tao, Yao, et autres
Publié: (2025)
par: Tao, Yao, et autres
Publié: (2025)
Not All Edges are Equally Robust: Evaluating the Robustness of Ranking-Based Federated Learning
par: Gong, Zirui, et autres
Publié: (2025)
par: Gong, Zirui, et autres
Publié: (2025)
Dynamic Token Compression for Efficient Video Understanding through Reinforcement Learning
par: Wang, Shida, et autres
Publié: (2026)
par: Wang, Shida, et autres
Publié: (2026)
OWT: A Foundational Organ-Wise Tokenization Framework for Medical Imaging
par: Song, Sifan, et autres
Publié: (2025)
par: Song, Sifan, et autres
Publié: (2025)
Empowering Character-level Text Infilling by Eliminating Sub-Tokens
par: Ren, Houxing, et autres
Publié: (2024)
par: Ren, Houxing, et autres
Publié: (2024)
Not All Noises Are Created Equally:Diffusion Noise Selection and Optimization
par: Qi, Zipeng, et autres
Publié: (2024)
par: Qi, Zipeng, et autres
Publié: (2024)
Token Bottleneck: One Token to Remember Dynamics
par: Kim, Taekyung, et autres
Publié: (2025)
par: Kim, Taekyung, et autres
Publié: (2025)
Behavior-Equivalent Token: Single-Token Replacement for Long Prompts in LLMs
par: Dong, Jiancheng, et autres
Publié: (2025)
par: Dong, Jiancheng, et autres
Publié: (2025)
One Tokenizer To Rule Them All: Emergent Language Plasticity via Multilingual Tokenizers
par: Abagyan, Diana, et autres
Publié: (2025)
par: Abagyan, Diana, et autres
Publié: (2025)
TokensGen: Harnessing Condensed Tokens for Long Video Generation
par: Ouyang, Wenqi, et autres
Publié: (2025)
par: Ouyang, Wenqi, et autres
Publié: (2025)
In-context Demonstration Matters: On Prompt Optimization for Pseudo-Supervision Refinement
par: Zhang, Zhen-Yu, et autres
Publié: (2024)
par: Zhang, Zhen-Yu, et autres
Publié: (2024)
Robust Reasoning via Dynamic Token Selection for Distribution-Aligned Self-Distillation
par: Zhang, Ruiqi, et autres
Publié: (2026)
par: Zhang, Ruiqi, et autres
Publié: (2026)
Semiparametric Token-Sequence Co-Supervision
par: Lee, Hyunji, et autres
Publié: (2024)
par: Lee, Hyunji, et autres
Publié: (2024)
Documents similaires
-
Not All Tokens and Heads Are Equally Important: Dual-Level Attention Intervention for Hallucination Mitigation
par: Tang, Lexiang, et autres
Publié: (2025) -
Image Tokens Matter: Mitigating Hallucination in Discrete Tokenizer-based Large Vision-Language Models via Latent Editing
par: Wang, Weixing, et autres
Publié: (2025) -
SimCT: Recovering Lost Supervision for Cross-Tokenizer On-Policy Distillation
par: Sun, Jie, et autres
Publié: (2026) -
VQ-Seg: Vector-Quantized Token Perturbation for Semi-Supervised Medical Image Segmentation
par: Yang, Sicheng, et autres
Publié: (2026) -
Not All Data Are Unlearned Equally
par: Krishnan, Aravind, et autres
Publié: (2025)