Salvato in:
| Autori principali: | Wu, Zijun, Hao, Yongchang, Mou, Lili |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2025
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2502.04501 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
TokMem: One-Token Procedural Memory for Large Language Models
di: Wu, Zijun, et al.
Pubblicazione: (2025)
di: Wu, Zijun, et al.
Pubblicazione: (2025)
Zero-Shot Continuous Prompt Transfer: Generalizing Task Semantics Across Language Models
di: Wu, Zijun, et al.
Pubblicazione: (2023)
di: Wu, Zijun, et al.
Pubblicazione: (2023)
LLMR: Knowledge Distillation with a Large Language Model-Induced Reward
di: Li, Dongheng, et al.
Pubblicazione: (2024)
di: Li, Dongheng, et al.
Pubblicazione: (2024)
Multi-Persona Thinking for Bias Mitigation in Large Language Models
di: Chen, Yuxing, et al.
Pubblicazione: (2026)
di: Chen, Yuxing, et al.
Pubblicazione: (2026)
The Emergence of Chunking Structures with Hierarchical RNN
di: Wu, Zijun, et al.
Pubblicazione: (2023)
di: Wu, Zijun, et al.
Pubblicazione: (2023)
Flora: Low-Rank Adapters Are Secretly Gradient Compressors
di: Hao, Yongchang, et al.
Pubblicazione: (2024)
di: Hao, Yongchang, et al.
Pubblicazione: (2024)
Cactus: Accelerating Auto-Regressive Decoding with Constrained Acceptance Speculative Sampling
di: Hao, Yongchang, et al.
Pubblicazione: (2026)
di: Hao, Yongchang, et al.
Pubblicazione: (2026)
Exploring Model Invariance with Discrete Search for Ultra-Low-Bit Quantization
di: Wen, Yuqiao, et al.
Pubblicazione: (2025)
di: Wen, Yuqiao, et al.
Pubblicazione: (2025)
Efficient Prompt Tuning by Multi-Space Projection and Prompt Fusion
di: Lan, Pengxiang, et al.
Pubblicazione: (2024)
di: Lan, Pengxiang, et al.
Pubblicazione: (2024)
Ginger: An Efficient Curvature Approximation with Linear Complexity for General Neural Networks
di: Hao, Yongchang, et al.
Pubblicazione: (2024)
di: Hao, Yongchang, et al.
Pubblicazione: (2024)
NeuZip: Memory-Efficient Training and Inference with Dynamic Compression of Neural Networks
di: Hao, Yongchang, et al.
Pubblicazione: (2024)
di: Hao, Yongchang, et al.
Pubblicazione: (2024)
RePrompT: Recurrent Prompt Tuning for Integrating Structured EHR Encoders with Large Language Models
di: Moghaddam, Arya Hadizadeh, et al.
Pubblicazione: (2026)
di: Moghaddam, Arya Hadizadeh, et al.
Pubblicazione: (2026)
Few-Shot Dialogue Summarization via Skeleton-Assisted Prompt Transfer in Prompt Tuning
di: Xie, Kaige, et al.
Pubblicazione: (2023)
di: Xie, Kaige, et al.
Pubblicazione: (2023)
KETCHUP: K-Step Return Estimation for Sequential Knowledge Distillation
di: Fan, Jiabin, et al.
Pubblicazione: (2025)
di: Fan, Jiabin, et al.
Pubblicazione: (2025)
A Dual-View Approach to Classifying Radiology Reports by Co-Training
di: Han, Yutong, et al.
Pubblicazione: (2024)
di: Han, Yutong, et al.
Pubblicazione: (2024)
Tree-Averaging Algorithms for Ensemble-Based Unsupervised Discontinuous Constituency Parsing
di: Shayegh, Behzad, et al.
Pubblicazione: (2024)
di: Shayegh, Behzad, et al.
Pubblicazione: (2024)
Better Prompt Compression Without Multi-Layer Perceptrons
di: Honig, Edouardo, et al.
Pubblicazione: (2025)
di: Honig, Edouardo, et al.
Pubblicazione: (2025)
A Decoding Algorithm for Length-Control Summarization Based on Directed Acyclic Transformers
di: Huang, Chenyang, et al.
Pubblicazione: (2025)
di: Huang, Chenyang, et al.
Pubblicazione: (2025)
Multilingual Non-Autoregressive Machine Translation without Knowledge Distillation
di: Huang, Chenyang, et al.
Pubblicazione: (2025)
di: Huang, Chenyang, et al.
Pubblicazione: (2025)
Exploiting the Index Gradients for Optimization-Based Jailbreaking on Large Language Models
di: Li, Jiahui, et al.
Pubblicazione: (2024)
di: Li, Jiahui, et al.
Pubblicazione: (2024)
Structured Prompt Optimization for Few-Shot Text Classification via Semantic Alignment in Latent Space
di: Zheng, Jiasen, et al.
Pubblicazione: (2026)
di: Zheng, Jiasen, et al.
Pubblicazione: (2026)
SG-Bench: Evaluating LLM Safety Generalization Across Diverse Tasks and Prompt Types
di: Mou, Yutao, et al.
Pubblicazione: (2024)
di: Mou, Yutao, et al.
Pubblicazione: (2024)
Optimizing Soft Prompt Tuning via Structural Evolution
di: Huang, Zhenzhen, et al.
Pubblicazione: (2026)
di: Huang, Zhenzhen, et al.
Pubblicazione: (2026)
Investigating Thinking Behaviours of Reasoning-Based Language Models for Social Bias Mitigation
di: Luo, Guoqing, et al.
Pubblicazione: (2025)
di: Luo, Guoqing, et al.
Pubblicazione: (2025)
Prompt, Translate, Fine-Tune, Re-Initialize, or Instruction-Tune? Adapting LLMs for In-Context Learning in Low-Resource Languages
di: Toukmaji, Christopher, et al.
Pubblicazione: (2025)
di: Toukmaji, Christopher, et al.
Pubblicazione: (2025)
Breaking Physical and Linguistic Borders: Multilingual Federated Prompt Tuning for Low-Resource Languages
di: Zhao, Wanru, et al.
Pubblicazione: (2025)
di: Zhao, Wanru, et al.
Pubblicazione: (2025)
PromptRad: Knowledge-Enhanced Multi-Label Prompt-Tuning for Low-Resource Radiology Report Labeling
di: Lin, Ying-Jia, et al.
Pubblicazione: (2026)
di: Lin, Ying-Jia, et al.
Pubblicazione: (2026)
Efficient and Effective Prompt Tuning via Prompt Decomposition and Compressed Outer Product
di: Lan, Pengxiang, et al.
Pubblicazione: (2025)
di: Lan, Pengxiang, et al.
Pubblicazione: (2025)
PromptFix: Few-shot Backdoor Removal via Adversarial Prompt Tuning
di: Zhang, Tianrong, et al.
Pubblicazione: (2024)
di: Zhang, Tianrong, et al.
Pubblicazione: (2024)
A Survey on Prompt Tuning
di: Li, Zongqian, et al.
Pubblicazione: (2025)
di: Li, Zongqian, et al.
Pubblicazione: (2025)
LaMDA: Large Model Fine-Tuning via Spectrally Decomposed Low-Dimensional Adaptation
di: Azizi, Seyedarmin, et al.
Pubblicazione: (2024)
di: Azizi, Seyedarmin, et al.
Pubblicazione: (2024)
FPT: Feature Prompt Tuning for Few-shot Readability Assessment
di: Wang, Ziyang, et al.
Pubblicazione: (2024)
di: Wang, Ziyang, et al.
Pubblicazione: (2024)
Self-Prompt Tuning: Enable Autonomous Role-Playing in LLMs
di: Kong, Aobo, et al.
Pubblicazione: (2024)
di: Kong, Aobo, et al.
Pubblicazione: (2024)
Prompt-Level Reward Specifications for Open-Ended Post-Training
di: Weng, Zijun, et al.
Pubblicazione: (2026)
di: Weng, Zijun, et al.
Pubblicazione: (2026)
LongLLMLingua: Accelerating and Enhancing LLMs in Long Context Scenarios via Prompt Compression
di: Jiang, Huiqiang, et al.
Pubblicazione: (2023)
di: Jiang, Huiqiang, et al.
Pubblicazione: (2023)
C-Evolve: Consensus-based Evolution for Prompt Groups
di: Li, Tiancheng, et al.
Pubblicazione: (2025)
di: Li, Tiancheng, et al.
Pubblicazione: (2025)
Mitigating Forgetting in LLM Fine-Tuning via Low-Perplexity Token Learning
di: Wu, Chao-Chung, et al.
Pubblicazione: (2025)
di: Wu, Chao-Chung, et al.
Pubblicazione: (2025)
Dual-Phase Accelerated Prompt Optimization
di: Yang, Muchen, et al.
Pubblicazione: (2024)
di: Yang, Muchen, et al.
Pubblicazione: (2024)
Revisiting Intermediate-Layer Matching in Knowledge Distillation: Layer-Selection Strategy Doesn't Matter (Much)
di: Yu, Zony, et al.
Pubblicazione: (2025)
di: Yu, Zony, et al.
Pubblicazione: (2025)
Multi-BERT: Leveraging Adapters and Prompt Tuning for Low-Resource Multi-Domain Adaptation
di: Azad, Parham Abed, et al.
Pubblicazione: (2024)
di: Azad, Parham Abed, et al.
Pubblicazione: (2024)
Documenti analoghi
-
TokMem: One-Token Procedural Memory for Large Language Models
di: Wu, Zijun, et al.
Pubblicazione: (2025) -
Zero-Shot Continuous Prompt Transfer: Generalizing Task Semantics Across Language Models
di: Wu, Zijun, et al.
Pubblicazione: (2023) -
LLMR: Knowledge Distillation with a Large Language Model-Induced Reward
di: Li, Dongheng, et al.
Pubblicazione: (2024) -
Multi-Persona Thinking for Bias Mitigation in Large Language Models
di: Chen, Yuxing, et al.
Pubblicazione: (2026) -
The Emergence of Chunking Structures with Hierarchical RNN
di: Wu, Zijun, et al.
Pubblicazione: (2023)