Salvato in:
| Autori principali: | Tang, Jiwei, Xu, Jin, Lu, Tingwei, Zhang, Zhicheng, Zhao, Yiming, Hai, Lin, Zheng, Hai-Tao |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2024
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2409.19272 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
GMSA: Enhancing Context Compression via Group Merging and Layer Semantic Alignment
di: Tang, Jiwei, et al.
Pubblicazione: (2025)
di: Tang, Jiwei, et al.
Pubblicazione: (2025)
Read As Human: Compressing Context via Parallelizable Close Reading and Skimming
di: Tang, Jiwei, et al.
Pubblicazione: (2026)
di: Tang, Jiwei, et al.
Pubblicazione: (2026)
SemantiCache: Efficient KV Cache Compression via Semantic Chunking and Clustered Merging
di: Wu, Shunlong, et al.
Pubblicazione: (2026)
di: Wu, Shunlong, et al.
Pubblicazione: (2026)
COMI: Coarse-to-fine Context Compression via Marginal Information Gain
di: Tang, Jiwei, et al.
Pubblicazione: (2026)
di: Tang, Jiwei, et al.
Pubblicazione: (2026)
Generalizable Chain-of-Thought Prompting in Mixed-task Scenarios with Large Language Models
di: Zou, Anni, et al.
Pubblicazione: (2023)
di: Zou, Anni, et al.
Pubblicazione: (2023)
LongLLMLingua: Accelerating and Enhancing LLMs in Long Context Scenarios via Prompt Compression
di: Jiang, Huiqiang, et al.
Pubblicazione: (2023)
di: Jiang, Huiqiang, et al.
Pubblicazione: (2023)
Long Context Compression with Activation Beacon
di: Zhang, Peitian, et al.
Pubblicazione: (2024)
di: Zhang, Peitian, et al.
Pubblicazione: (2024)
ParallelComp: Parallel Long-Context Compressor for Length Extrapolation
di: Xiong, Jing, et al.
Pubblicazione: (2025)
di: Xiong, Jing, et al.
Pubblicazione: (2025)
From Token to Line: Enhancing Code Generation with a Long-Term Perspective
di: Lu, Tingwei, et al.
Pubblicazione: (2025)
di: Lu, Tingwei, et al.
Pubblicazione: (2025)
RAISE: Reinforced Adaptive Instruction Selection For Large Language Models
di: Lv, Qingsong, et al.
Pubblicazione: (2025)
di: Lv, Qingsong, et al.
Pubblicazione: (2025)
500xCompressor: Generalized Prompt Compression for Large Language Models
di: Li, Zongqian, et al.
Pubblicazione: (2024)
di: Li, Zongqian, et al.
Pubblicazione: (2024)
DAC: A Dynamic Attention-aware Approach for Task-Agnostic Prompt Compression
di: Zhao, Yi, et al.
Pubblicazione: (2025)
di: Zhao, Yi, et al.
Pubblicazione: (2025)
MOOSComp: Improving Lightweight Long-Context Compressor via Mitigating Over-Smoothing and Incorporating Outlier Scores
di: Zhou, Fengwei, et al.
Pubblicazione: (2025)
di: Zhou, Fengwei, et al.
Pubblicazione: (2025)
Compressing Lengthy Context With UltraGist
di: Zhang, Peitian, et al.
Pubblicazione: (2024)
di: Zhang, Peitian, et al.
Pubblicazione: (2024)
Beyond Position Bias: Shifting Context Compression from Position-Driven to Semantic-Driven
di: Tang, Jiwei, et al.
Pubblicazione: (2026)
di: Tang, Jiwei, et al.
Pubblicazione: (2026)
ACC: Compiling Agent Trajectories for Long-Context Training
di: Su, Qisheng, et al.
Pubblicazione: (2026)
di: Su, Qisheng, et al.
Pubblicazione: (2026)
AdmTree: Compressing Lengthy Context with Adaptive Semantic Trees
di: Li, Yangning, et al.
Pubblicazione: (2025)
di: Li, Yangning, et al.
Pubblicazione: (2025)
QAEA-DR: A Unified Text Augmentation Framework for Dense Retrieval
di: Tan, Hongming, et al.
Pubblicazione: (2024)
di: Tan, Hongming, et al.
Pubblicazione: (2024)
GRKV: Global Regression for Training-Free KV Cache Compression in Long-Context LLMs
di: Peng, Junjie, et al.
Pubblicazione: (2026)
di: Peng, Junjie, et al.
Pubblicazione: (2026)
InfLLM: Training-Free Long-Context Extrapolation for LLMs with an Efficient Context Memory
di: Xiao, Chaojun, et al.
Pubblicazione: (2024)
di: Xiao, Chaojun, et al.
Pubblicazione: (2024)
Ultra Memory-Efficient On-FPGA Training of Transformers via Tensor-Compressed Optimization
di: Tian, Jiayi, et al.
Pubblicazione: (2025)
di: Tian, Jiayi, et al.
Pubblicazione: (2025)
Are Long-LLMs A Necessity For Long-Context Tasks?
di: Qian, Hongjin, et al.
Pubblicazione: (2024)
di: Qian, Hongjin, et al.
Pubblicazione: (2024)
DAST: Context-Aware Compression in LLMs via Dynamic Allocation of Soft Tokens
di: Chen, Shaoshen, et al.
Pubblicazione: (2025)
di: Chen, Shaoshen, et al.
Pubblicazione: (2025)
TransCompressor: LLM-Powered Multimodal Data Compression for Smart Transportation
di: Yang, Huanqi, et al.
Pubblicazione: (2024)
di: Yang, Huanqi, et al.
Pubblicazione: (2024)
Characterizing Prompt Compression Methods for Long Context Inference
di: Jha, Siddharth, et al.
Pubblicazione: (2024)
di: Jha, Siddharth, et al.
Pubblicazione: (2024)
Auxiliary-Hyperparameter-Free Sampling: Entropy Equilibrium for Text Generation
di: Cai, Xiaodong, et al.
Pubblicazione: (2025)
di: Cai, Xiaodong, et al.
Pubblicazione: (2025)
Cross-Family Speculative Prefill: Training-Free Long-Context Compression with Small Draft Models
di: Upasani, Shubhangi, et al.
Pubblicazione: (2026)
di: Upasani, Shubhangi, et al.
Pubblicazione: (2026)
DSPC: Dual-Stage Progressive Compression Framework for Efficient Long-Context Reasoning
di: Gao, Yaxin, et al.
Pubblicazione: (2025)
di: Gao, Yaxin, et al.
Pubblicazione: (2025)
PoC: Performance-oriented Context Compression for Large Language Models via Performance Prediction
di: Zhao, Runsong, et al.
Pubblicazione: (2026)
di: Zhao, Runsong, et al.
Pubblicazione: (2026)
From Prompts to Constructs: A Dual-Validity Framework for LLM Research in Psychology
di: Lin, Zhicheng
Pubblicazione: (2025)
di: Lin, Zhicheng
Pubblicazione: (2025)
Reference Trustable Decoding: A Training-Free Augmentation Paradigm for Large Language Models
di: Shi, Luohe, et al.
Pubblicazione: (2024)
di: Shi, Luohe, et al.
Pubblicazione: (2024)
GLaPE: Gold Label-agnostic Prompt Evaluation and Optimization for Large Language Model
di: Zhang, Xuanchang, et al.
Pubblicazione: (2024)
di: Zhang, Xuanchang, et al.
Pubblicazione: (2024)
UniGist: Towards General and Hardware-aligned Sequence-level Long Context Compression
di: Deng, Chenlong, et al.
Pubblicazione: (2025)
di: Deng, Chenlong, et al.
Pubblicazione: (2025)
Efficient Prompt Compression with Evaluator Heads for Long-Context Transformer Inference
di: Fei, Weizhi, et al.
Pubblicazione: (2025)
di: Fei, Weizhi, et al.
Pubblicazione: (2025)
Data Distribution Matters: A Data-Centric Perspective on Context Compression for Large Language Model
di: Lv, Kangtao, et al.
Pubblicazione: (2026)
di: Lv, Kangtao, et al.
Pubblicazione: (2026)
Large Language Model as Token Compressor and Decompressor
di: Li, Wenbing, et al.
Pubblicazione: (2026)
di: Li, Wenbing, et al.
Pubblicazione: (2026)
Retaining Key Information under High Compression Ratios: Query-Guided Compressor for LLMs
di: Cao, Zhiwei, et al.
Pubblicazione: (2024)
di: Cao, Zhiwei, et al.
Pubblicazione: (2024)
Training-Free Long-Context Scaling of Large Language Models
di: An, Chenxin, et al.
Pubblicazione: (2024)
di: An, Chenxin, et al.
Pubblicazione: (2024)
BEAVER: A Training-Free Hierarchical Prompt Compression Method via Structure-Aware Page Selection
di: Hu, Zhengpei, et al.
Pubblicazione: (2026)
di: Hu, Zhengpei, et al.
Pubblicazione: (2026)
FLAT-LLM: Fine-grained Low-rank Activation Space Transformation for Large Language Model Compression
di: Tian, Jiayi, et al.
Pubblicazione: (2025)
di: Tian, Jiayi, et al.
Pubblicazione: (2025)
Documenti analoghi
-
GMSA: Enhancing Context Compression via Group Merging and Layer Semantic Alignment
di: Tang, Jiwei, et al.
Pubblicazione: (2025) -
Read As Human: Compressing Context via Parallelizable Close Reading and Skimming
di: Tang, Jiwei, et al.
Pubblicazione: (2026) -
SemantiCache: Efficient KV Cache Compression via Semantic Chunking and Clustered Merging
di: Wu, Shunlong, et al.
Pubblicazione: (2026) -
COMI: Coarse-to-fine Context Compression via Marginal Information Gain
di: Tang, Jiwei, et al.
Pubblicazione: (2026) -
Generalizable Chain-of-Thought Prompting in Mixed-task Scenarios with Large Language Models
di: Zou, Anni, et al.
Pubblicazione: (2023)