:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autori principali:	Tang, Jiwei, Xu, Jin, Lu, Tingwei, Zhang, Zhicheng, Zhao, Yiming, Hai, Lin, Zheng, Hai-Tao
Natura:	Preprint
Pubblicazione:	2024
Soggetti:	Computation and Language
Accesso online:	https://arxiv.org/abs/2409.19272
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

GMSA: Enhancing Context Compression via Group Merging and Layer Semantic Alignment
di: Tang, Jiwei, et al.
Pubblicazione: (2025)

Read As Human: Compressing Context via Parallelizable Close Reading and Skimming
di: Tang, Jiwei, et al.
Pubblicazione: (2026)

SemantiCache: Efficient KV Cache Compression via Semantic Chunking and Clustered Merging
di: Wu, Shunlong, et al.
Pubblicazione: (2026)

COMI: Coarse-to-fine Context Compression via Marginal Information Gain
di: Tang, Jiwei, et al.
Pubblicazione: (2026)

Generalizable Chain-of-Thought Prompting in Mixed-task Scenarios with Large Language Models
di: Zou, Anni, et al.
Pubblicazione: (2023)

LongLLMLingua: Accelerating and Enhancing LLMs in Long Context Scenarios via Prompt Compression
di: Jiang, Huiqiang, et al.
Pubblicazione: (2023)

Long Context Compression with Activation Beacon
di: Zhang, Peitian, et al.
Pubblicazione: (2024)

ParallelComp: Parallel Long-Context Compressor for Length Extrapolation
di: Xiong, Jing, et al.
Pubblicazione: (2025)

From Token to Line: Enhancing Code Generation with a Long-Term Perspective
di: Lu, Tingwei, et al.
Pubblicazione: (2025)

RAISE: Reinforced Adaptive Instruction Selection For Large Language Models
di: Lv, Qingsong, et al.
Pubblicazione: (2025)

500xCompressor: Generalized Prompt Compression for Large Language Models
di: Li, Zongqian, et al.
Pubblicazione: (2024)

DAC: A Dynamic Attention-aware Approach for Task-Agnostic Prompt Compression
di: Zhao, Yi, et al.
Pubblicazione: (2025)

MOOSComp: Improving Lightweight Long-Context Compressor via Mitigating Over-Smoothing and Incorporating Outlier Scores
di: Zhou, Fengwei, et al.
Pubblicazione: (2025)

Compressing Lengthy Context With UltraGist
di: Zhang, Peitian, et al.
Pubblicazione: (2024)

Beyond Position Bias: Shifting Context Compression from Position-Driven to Semantic-Driven
di: Tang, Jiwei, et al.
Pubblicazione: (2026)

ACC: Compiling Agent Trajectories for Long-Context Training
di: Su, Qisheng, et al.
Pubblicazione: (2026)

AdmTree: Compressing Lengthy Context with Adaptive Semantic Trees
di: Li, Yangning, et al.
Pubblicazione: (2025)

QAEA-DR: A Unified Text Augmentation Framework for Dense Retrieval
di: Tan, Hongming, et al.
Pubblicazione: (2024)

GRKV: Global Regression for Training-Free KV Cache Compression in Long-Context LLMs
di: Peng, Junjie, et al.
Pubblicazione: (2026)

InfLLM: Training-Free Long-Context Extrapolation for LLMs with an Efficient Context Memory
di: Xiao, Chaojun, et al.
Pubblicazione: (2024)

Ultra Memory-Efficient On-FPGA Training of Transformers via Tensor-Compressed Optimization
di: Tian, Jiayi, et al.
Pubblicazione: (2025)

Are Long-LLMs A Necessity For Long-Context Tasks?
di: Qian, Hongjin, et al.
Pubblicazione: (2024)

DAST: Context-Aware Compression in LLMs via Dynamic Allocation of Soft Tokens
di: Chen, Shaoshen, et al.
Pubblicazione: (2025)

TransCompressor: LLM-Powered Multimodal Data Compression for Smart Transportation
di: Yang, Huanqi, et al.
Pubblicazione: (2024)

Characterizing Prompt Compression Methods for Long Context Inference
di: Jha, Siddharth, et al.
Pubblicazione: (2024)

Auxiliary-Hyperparameter-Free Sampling: Entropy Equilibrium for Text Generation
di: Cai, Xiaodong, et al.
Pubblicazione: (2025)

Cross-Family Speculative Prefill: Training-Free Long-Context Compression with Small Draft Models
di: Upasani, Shubhangi, et al.
Pubblicazione: (2026)

DSPC: Dual-Stage Progressive Compression Framework for Efficient Long-Context Reasoning
di: Gao, Yaxin, et al.
Pubblicazione: (2025)

PoC: Performance-oriented Context Compression for Large Language Models via Performance Prediction
di: Zhao, Runsong, et al.
Pubblicazione: (2026)

From Prompts to Constructs: A Dual-Validity Framework for LLM Research in Psychology
di: Lin, Zhicheng
Pubblicazione: (2025)

Reference Trustable Decoding: A Training-Free Augmentation Paradigm for Large Language Models
di: Shi, Luohe, et al.
Pubblicazione: (2024)

GLaPE: Gold Label-agnostic Prompt Evaluation and Optimization for Large Language Model
di: Zhang, Xuanchang, et al.
Pubblicazione: (2024)

UniGist: Towards General and Hardware-aligned Sequence-level Long Context Compression
di: Deng, Chenlong, et al.
Pubblicazione: (2025)

Efficient Prompt Compression with Evaluator Heads for Long-Context Transformer Inference
di: Fei, Weizhi, et al.
Pubblicazione: (2025)

Data Distribution Matters: A Data-Centric Perspective on Context Compression for Large Language Model
di: Lv, Kangtao, et al.
Pubblicazione: (2026)

Large Language Model as Token Compressor and Decompressor
di: Li, Wenbing, et al.
Pubblicazione: (2026)

Retaining Key Information under High Compression Ratios: Query-Guided Compressor for LLMs
di: Cao, Zhiwei, et al.
Pubblicazione: (2024)

Training-Free Long-Context Scaling of Large Language Models
di: An, Chenxin, et al.
Pubblicazione: (2024)

BEAVER: A Training-Free Hierarchical Prompt Compression Method via Structure-Aware Page Selection
di: Hu, Zhengpei, et al.
Pubblicazione: (2026)

FLAT-LLM: Fine-grained Low-rank Activation Space Transformation for Large Language Model Compression
di: Tian, Jiayi, et al.
Pubblicazione: (2025)