Salvato in:
| Autori principali: | Fang, Jiarui, Zhao, Shangchun |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2024
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2405.07719 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
An Adaptive Placement and Parallelism Framework for Accelerating RLHF Training
di: Xiao, Youshao, et al.
Pubblicazione: (2023)
di: Xiao, Youshao, et al.
Pubblicazione: (2023)
An Efficient Hybrid Sparse Attention with CPU-GPU Parallelism for Long-Context Inference
di: Yao, Feiyu, et al.
Pubblicazione: (2026)
di: Yao, Feiyu, et al.
Pubblicazione: (2026)
Long-Context Attention Benchmark: From Kernel Efficiency to Distributed Context Parallelism
di: Bu, Tao, et al.
Pubblicazione: (2025)
di: Bu, Tao, et al.
Pubblicazione: (2025)
SlimPipe: Memory-Thrifty and Efficient Pipeline Parallelism for Long-Context LLM Training
di: Li, Zhouyang, et al.
Pubblicazione: (2025)
di: Li, Zhouyang, et al.
Pubblicazione: (2025)
Generalized Parallel Scaling with Interdependent Generations
di: Dong, Harry, et al.
Pubblicazione: (2025)
di: Dong, Harry, et al.
Pubblicazione: (2025)
How Well Can a Long Sequence Model Model Long Sequences? Comparing Architechtural Inductive Biases on Long-Context Abilities
di: Huang, Jerry
Pubblicazione: (2024)
di: Huang, Jerry
Pubblicazione: (2024)
PULSE-ICU: A Pretrained Unified Long-Sequence Encoder for Multi-task Prediction in Intensive Care Units
di: Jang, Sejeong, et al.
Pubblicazione: (2025)
di: Jang, Sejeong, et al.
Pubblicazione: (2025)
APE: Faster and Longer Context-Augmented Generation via Adaptive Parallel Encoding
di: Yang, Xinyu, et al.
Pubblicazione: (2025)
di: Yang, Xinyu, et al.
Pubblicazione: (2025)
Retrieval Augmented Generation or Long-Context LLMs? A Comprehensive Study and Hybrid Approach
di: Li, Zhuowan, et al.
Pubblicazione: (2024)
di: Li, Zhuowan, et al.
Pubblicazione: (2024)
Unifying Sequences, Structures, and Descriptions for Any-to-Any Protein Generation with the Large Multimodal Model HelixProtX
di: Chen, Zhiyuan, et al.
Pubblicazione: (2024)
di: Chen, Zhiyuan, et al.
Pubblicazione: (2024)
Breaking the Context Bottleneck on Long Time Series Forecasting
di: Ma, Chao, et al.
Pubblicazione: (2024)
di: Ma, Chao, et al.
Pubblicazione: (2024)
Generative Fuzzy System for Sequence Generation
di: Yang, Hailong, et al.
Pubblicazione: (2024)
di: Yang, Hailong, et al.
Pubblicazione: (2024)
Generalized Preference Optimization: A Unified Approach to Offline Alignment
di: Tang, Yunhao, et al.
Pubblicazione: (2024)
di: Tang, Yunhao, et al.
Pubblicazione: (2024)
Generative Distribution Prediction: A Unified Approach to Multimodal Learning
di: Tian, Xinyu, et al.
Pubblicazione: (2025)
di: Tian, Xinyu, et al.
Pubblicazione: (2025)
KV Admission: Learning What to Write for Efficient Long-Context Inference
di: Huang, Yen-Chieh, et al.
Pubblicazione: (2025)
di: Huang, Yen-Chieh, et al.
Pubblicazione: (2025)
Generative AI for Controllable Protein Sequence Design: A Survey
di: Zhu, Yiheng, et al.
Pubblicazione: (2024)
di: Zhu, Yiheng, et al.
Pubblicazione: (2024)
Generative Diffusion Prior Distillation for Long-Context Knowledge Transfer
di: Udayangani, Nilushika, et al.
Pubblicazione: (2026)
di: Udayangani, Nilushika, et al.
Pubblicazione: (2026)
MOM: Memory-Efficient Offloaded Mini-Sequence Inference for Long Context Language Models
di: Zhang, Junyang, et al.
Pubblicazione: (2025)
di: Zhang, Junyang, et al.
Pubblicazione: (2025)
TRISKELION-1: Unified Descriptive-Predictive-Generative AI
di: Kumar, Nardeep, et al.
Pubblicazione: (2025)
di: Kumar, Nardeep, et al.
Pubblicazione: (2025)
StreamBP: Memory-Efficient Exact Backpropagation for Long Sequence Training of LLMs
di: Luo, Qijun, et al.
Pubblicazione: (2025)
di: Luo, Qijun, et al.
Pubblicazione: (2025)
Parallel Structures in Pre-training Data Yield In-Context Learning
di: Chen, Yanda, et al.
Pubblicazione: (2024)
di: Chen, Yanda, et al.
Pubblicazione: (2024)
Long Input Sequence Network for Long Time Series Forecasting
di: Ma, Chao, et al.
Pubblicazione: (2024)
di: Ma, Chao, et al.
Pubblicazione: (2024)
Efficient Low Rank Attention for Long-Context Inference in Large Language Models
di: Li, Tenghui, et al.
Pubblicazione: (2025)
di: Li, Tenghui, et al.
Pubblicazione: (2025)
ParaDySe: A Parallel-Strategy Switching Framework for Dynamic Sequence Lengths in Transformer
di: Ou, Zhixin, et al.
Pubblicazione: (2025)
di: Ou, Zhixin, et al.
Pubblicazione: (2025)
Long Context In-Context Compression by Getting to the Gist of Gisting
di: Petrov, Aleksandar, et al.
Pubblicazione: (2025)
di: Petrov, Aleksandar, et al.
Pubblicazione: (2025)
Baguan-TS: A Sequence-Native In-Context Learning Model for Time Series Forecasting with Covariates
di: Yang, Linxiao, et al.
Pubblicazione: (2026)
di: Yang, Linxiao, et al.
Pubblicazione: (2026)
Scaling Laws and In-Context Learning: A Unified Theoretical Framework
di: Mehta, Sushant, et al.
Pubblicazione: (2025)
di: Mehta, Sushant, et al.
Pubblicazione: (2025)
Technical Debt in In-Context Learning: Diminishing Efficiency in Long Context
di: Joo, Taejong, et al.
Pubblicazione: (2025)
di: Joo, Taejong, et al.
Pubblicazione: (2025)
Artificial Hippocampus Networks for Efficient Long-Context Modeling
di: Fang, Yunhao, et al.
Pubblicazione: (2025)
di: Fang, Yunhao, et al.
Pubblicazione: (2025)
Context-Former: Stitching via Latent Conditioned Sequence Modeling
di: Zhang, Ziqi, et al.
Pubblicazione: (2024)
di: Zhang, Ziqi, et al.
Pubblicazione: (2024)
Gradient Flow Drifting: Generative Modeling via Wasserstein Gradient Flows of KDE-Approximated Divergences
di: Cao, Jiarui, et al.
Pubblicazione: (2026)
di: Cao, Jiarui, et al.
Pubblicazione: (2026)
UFO: A Unified Flow-Oriented Framework for Robust Continual Graph Learning
di: Zhang, Danhui, et al.
Pubblicazione: (2026)
di: Zhang, Danhui, et al.
Pubblicazione: (2026)
UniGEM: A Unified Approach to Generation and Property Prediction for Molecules
di: Feng, Shikun, et al.
Pubblicazione: (2024)
di: Feng, Shikun, et al.
Pubblicazione: (2024)
High-order Knowledge Based Network Controllability Robustness Prediction: A Hypergraph Neural Network Approach
di: Mo, Shibing, et al.
Pubblicazione: (2026)
di: Mo, Shibing, et al.
Pubblicazione: (2026)
Block-Biased Mamba for Long-Range Sequence Processing
di: Yu, Annan, et al.
Pubblicazione: (2025)
di: Yu, Annan, et al.
Pubblicazione: (2025)
AI Pangaea: Unifying Intelligence Islands for Adapting Myriad Tasks
di: Chang, Jianlong, et al.
Pubblicazione: (2025)
di: Chang, Jianlong, et al.
Pubblicazione: (2025)
TracLLM: A Generic Framework for Attributing Long Context LLMs
di: Wang, Yanting, et al.
Pubblicazione: (2025)
di: Wang, Yanting, et al.
Pubblicazione: (2025)
From Classical Probabilistic Latent Variable Models to Modern Generative AI: A Unified Perspective
di: Chen, Tianhua
Pubblicazione: (2025)
di: Chen, Tianhua
Pubblicazione: (2025)
DMax: Aggressive Parallel Decoding for dLLMs
di: Chen, Zigeng, et al.
Pubblicazione: (2026)
di: Chen, Zigeng, et al.
Pubblicazione: (2026)
The PokeAgent Challenge: Competitive and Long-Context Learning at Scale
di: Karten, Seth, et al.
Pubblicazione: (2026)
di: Karten, Seth, et al.
Pubblicazione: (2026)
Documenti analoghi
-
An Adaptive Placement and Parallelism Framework for Accelerating RLHF Training
di: Xiao, Youshao, et al.
Pubblicazione: (2023) -
An Efficient Hybrid Sparse Attention with CPU-GPU Parallelism for Long-Context Inference
di: Yao, Feiyu, et al.
Pubblicazione: (2026) -
Long-Context Attention Benchmark: From Kernel Efficiency to Distributed Context Parallelism
di: Bu, Tao, et al.
Pubblicazione: (2025) -
SlimPipe: Memory-Thrifty and Efficient Pipeline Parallelism for Long-Context LLM Training
di: Li, Zhouyang, et al.
Pubblicazione: (2025) -
Generalized Parallel Scaling with Interdependent Generations
di: Dong, Harry, et al.
Pubblicazione: (2025)