Salvato in:
| Autori principali: | Koledoye, Abidemi, Unachukwu, Chinemerem, Nwobu, Gold, Rana, Hasin |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2026
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2601.01237 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
Long-Context Attention Benchmark: From Kernel Efficiency to Distributed Context Parallelism
di: Bu, Tao, et al.
Pubblicazione: (2025)
di: Bu, Tao, et al.
Pubblicazione: (2025)
Technical Debt in In-Context Learning: Diminishing Efficiency in Long Context
di: Joo, Taejong, et al.
Pubblicazione: (2025)
di: Joo, Taejong, et al.
Pubblicazione: (2025)
Characterizing State Space Model and Hybrid Language Model Performance with Long Context
di: Mitra, Saptarshi, et al.
Pubblicazione: (2025)
di: Mitra, Saptarshi, et al.
Pubblicazione: (2025)
CoMeT: Collaborative Memory Transformer for Efficient Long Context Modeling
di: Zhao, Runsong, et al.
Pubblicazione: (2026)
di: Zhao, Runsong, et al.
Pubblicazione: (2026)
Context-Selective State Space Models: Feedback is All You Need
di: Zattra, Riccardo, et al.
Pubblicazione: (2025)
di: Zattra, Riccardo, et al.
Pubblicazione: (2025)
Analysis of Long Range Dependency Understanding in State Space Models
di: Ravikumar, Srividya, et al.
Pubblicazione: (2026)
di: Ravikumar, Srividya, et al.
Pubblicazione: (2026)
On the Robustness of Transformers against Context Hijacking for Linear Classification
di: Li, Tianle, et al.
Pubblicazione: (2025)
di: Li, Tianle, et al.
Pubblicazione: (2025)
100-LongBench: Are de facto Long-Context Benchmarks Literally Evaluating Long-Context Ability?
di: Yang, Wang, et al.
Pubblicazione: (2025)
di: Yang, Wang, et al.
Pubblicazione: (2025)
CADENCE: Context-Adaptive Depth Estimation for Navigation and Computational Efficiency
di: Johnsen, Timothy K, et al.
Pubblicazione: (2026)
di: Johnsen, Timothy K, et al.
Pubblicazione: (2026)
Technologies on Effectiveness and Efficiency: A Survey of State Spaces Models
di: Lv, Xingtai, et al.
Pubblicazione: (2025)
di: Lv, Xingtai, et al.
Pubblicazione: (2025)
Reconciling In-Context and In-Weight Learning via Dual Representation Space Encoding
di: Chen, Guanyu, et al.
Pubblicazione: (2026)
di: Chen, Guanyu, et al.
Pubblicazione: (2026)
LMAct: A Benchmark for In-Context Imitation Learning with Long Multimodal Demonstrations
di: Ruoss, Anian, et al.
Pubblicazione: (2024)
di: Ruoss, Anian, et al.
Pubblicazione: (2024)
Priming: Hybrid State Space Models From Pre-trained Transformers
di: Chattopadhyay, Aditya, et al.
Pubblicazione: (2026)
di: Chattopadhyay, Aditya, et al.
Pubblicazione: (2026)
Paged Attention Meets FlexAttention: Unlocking Long-Context Efficiency in Deployed Inference
di: Joshi, Thomas, et al.
Pubblicazione: (2025)
di: Joshi, Thomas, et al.
Pubblicazione: (2025)
PICASO: Permutation-Invariant Context Composition with State Space Models
di: Liu, Tian Yu, et al.
Pubblicazione: (2025)
di: Liu, Tian Yu, et al.
Pubblicazione: (2025)
OSWorld-Human: Benchmarking the Efficiency of Computer-Use Agents
di: Abhyankar, Reyna, et al.
Pubblicazione: (2025)
di: Abhyankar, Reyna, et al.
Pubblicazione: (2025)
ELITR-Bench: A Meeting Assistant Benchmark for Long-Context Language Models
di: Thonet, Thibaut, et al.
Pubblicazione: (2024)
di: Thonet, Thibaut, et al.
Pubblicazione: (2024)
AcademicEval: Live Long-Context LLM Benchmark
di: Zhang, Haozhen, et al.
Pubblicazione: (2025)
di: Zhang, Haozhen, et al.
Pubblicazione: (2025)
Scaling Limits of Long-Context Transformers
di: Bruno, Giuseppe, et al.
Pubblicazione: (2026)
di: Bruno, Giuseppe, et al.
Pubblicazione: (2026)
ProtAlign: Contrastive learning paradigm for Sequence and structure alignment
di: Ranganath, Aditya, et al.
Pubblicazione: (2026)
di: Ranganath, Aditya, et al.
Pubblicazione: (2026)
Graph-Mamba: Towards Long-Range Graph Sequence Modeling with Selective State Spaces
di: Wang, Chloe, et al.
Pubblicazione: (2024)
di: Wang, Chloe, et al.
Pubblicazione: (2024)
Long Code Arena: a Set of Benchmarks for Long-Context Code Models
di: Bogomolov, Egor, et al.
Pubblicazione: (2024)
di: Bogomolov, Egor, et al.
Pubblicazione: (2024)
MambaTS: Improved Selective State Space Models for Long-term Time Series Forecasting
di: Cai, Xiuding, et al.
Pubblicazione: (2024)
di: Cai, Xiuding, et al.
Pubblicazione: (2024)
Latent Behavior Diffusion for Sequential Reaction Generation in Dyadic Setting
di: Nguyen, Minh-Duc, et al.
Pubblicazione: (2025)
di: Nguyen, Minh-Duc, et al.
Pubblicazione: (2025)
λ: A Benchmark for Data-Efficiency in Long-Horizon Indoor Mobile Manipulation Robotics
di: Jaafar, Ahmed, et al.
Pubblicazione: (2024)
di: Jaafar, Ahmed, et al.
Pubblicazione: (2024)
DyGMamba: Efficiently Modeling Long-Term Temporal Dependency on Continuous-Time Dynamic Graphs with State Space Models
di: Ding, Zifeng, et al.
Pubblicazione: (2024)
di: Ding, Zifeng, et al.
Pubblicazione: (2024)
Towards Theoretical Understanding of Transformer Test-Time Computing: Investigation on In-Context Linear Regression
di: Chen, Xingwu, et al.
Pubblicazione: (2025)
di: Chen, Xingwu, et al.
Pubblicazione: (2025)
Unifying Model-Free Efficiency and Model-Based Representations via Latent Dynamics
di: Acharjee, Jashaswimalya, et al.
Pubblicazione: (2026)
di: Acharjee, Jashaswimalya, et al.
Pubblicazione: (2026)
Scale-Consistent State-Space Dynamics via Fractal of Stationary Transformations
di: Yu, Geunhyeok, et al.
Pubblicazione: (2026)
di: Yu, Geunhyeok, et al.
Pubblicazione: (2026)
Contextures: Representations from Contexts
di: Zhai, Runtian, et al.
Pubblicazione: (2025)
di: Zhai, Runtian, et al.
Pubblicazione: (2025)
Analyzing the Impact of Climate Change With Major Emphasis on Pollution: A Comparative Study of ML and Statistical Models in Time Series Data
di: Mishra, Anurag, et al.
Pubblicazione: (2024)
di: Mishra, Anurag, et al.
Pubblicazione: (2024)
Caregiver Talk Shapes Toddler Vision: A Computational Study of Dyadic Play
di: Schaumlöffel, Timothy, et al.
Pubblicazione: (2023)
di: Schaumlöffel, Timothy, et al.
Pubblicazione: (2023)
Revisiting In-Context Learning with Long Context Language Models
di: Baek, Jinheon, et al.
Pubblicazione: (2024)
di: Baek, Jinheon, et al.
Pubblicazione: (2024)
Compute-in-Memory Implementation of State Space Models for Event Sequence Processing
di: Zhang, Xiaoyu, et al.
Pubblicazione: (2025)
di: Zhang, Xiaoyu, et al.
Pubblicazione: (2025)
ICL-Router: In-Context Learned Model Representations for LLM Routing
di: Wang, Chenxu, et al.
Pubblicazione: (2025)
di: Wang, Chenxu, et al.
Pubblicazione: (2025)
Long Context In-Context Compression by Getting to the Gist of Gisting
di: Petrov, Aleksandar, et al.
Pubblicazione: (2025)
di: Petrov, Aleksandar, et al.
Pubblicazione: (2025)
Uncertainty Representations in State-Space Layers for Deep Reinforcement Learning under Partial Observability
di: Luis, Carlos E., et al.
Pubblicazione: (2024)
di: Luis, Carlos E., et al.
Pubblicazione: (2024)
Benchmarking the State of Networks with a Low-Cost Method Based on Reservoir Computing
di: Reimers, Felix Simon, et al.
Pubblicazione: (2025)
di: Reimers, Felix Simon, et al.
Pubblicazione: (2025)
Hybrid LSTM-Transformer Models for Profiling Highway-Railway Grade Crossings
di: Chatterjee, Kaustav, et al.
Pubblicazione: (2025)
di: Chatterjee, Kaustav, et al.
Pubblicazione: (2025)
CLOVER: A Test Case Generation Benchmark with Coverage, Long-Context, and Verification
di: Xu, Jiacheng, et al.
Pubblicazione: (2025)
di: Xu, Jiacheng, et al.
Pubblicazione: (2025)
Documenti analoghi
-
Long-Context Attention Benchmark: From Kernel Efficiency to Distributed Context Parallelism
di: Bu, Tao, et al.
Pubblicazione: (2025) -
Technical Debt in In-Context Learning: Diminishing Efficiency in Long Context
di: Joo, Taejong, et al.
Pubblicazione: (2025) -
Characterizing State Space Model and Hybrid Language Model Performance with Long Context
di: Mitra, Saptarshi, et al.
Pubblicazione: (2025) -
CoMeT: Collaborative Memory Transformer for Efficient Long Context Modeling
di: Zhao, Runsong, et al.
Pubblicazione: (2026) -
Context-Selective State Space Models: Feedback is All You Need
di: Zattra, Riccardo, et al.
Pubblicazione: (2025)