:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autori principali:	Fang, Jiarui, Zhao, Shangchun
Natura:	Preprint
Pubblicazione:	2024
Soggetti:	Machine Learning Artificial Intelligence
Accesso online:	https://arxiv.org/abs/2405.07719
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

An Adaptive Placement and Parallelism Framework for Accelerating RLHF Training
di: Xiao, Youshao, et al.
Pubblicazione: (2023)

An Efficient Hybrid Sparse Attention with CPU-GPU Parallelism for Long-Context Inference
di: Yao, Feiyu, et al.
Pubblicazione: (2026)

Long-Context Attention Benchmark: From Kernel Efficiency to Distributed Context Parallelism
di: Bu, Tao, et al.
Pubblicazione: (2025)

SlimPipe: Memory-Thrifty and Efficient Pipeline Parallelism for Long-Context LLM Training
di: Li, Zhouyang, et al.
Pubblicazione: (2025)

Generalized Parallel Scaling with Interdependent Generations
di: Dong, Harry, et al.
Pubblicazione: (2025)

How Well Can a Long Sequence Model Model Long Sequences? Comparing Architechtural Inductive Biases on Long-Context Abilities
di: Huang, Jerry
Pubblicazione: (2024)

PULSE-ICU: A Pretrained Unified Long-Sequence Encoder for Multi-task Prediction in Intensive Care Units
di: Jang, Sejeong, et al.
Pubblicazione: (2025)

APE: Faster and Longer Context-Augmented Generation via Adaptive Parallel Encoding
di: Yang, Xinyu, et al.
Pubblicazione: (2025)

Retrieval Augmented Generation or Long-Context LLMs? A Comprehensive Study and Hybrid Approach
di: Li, Zhuowan, et al.
Pubblicazione: (2024)

Unifying Sequences, Structures, and Descriptions for Any-to-Any Protein Generation with the Large Multimodal Model HelixProtX
di: Chen, Zhiyuan, et al.
Pubblicazione: (2024)

Breaking the Context Bottleneck on Long Time Series Forecasting
di: Ma, Chao, et al.
Pubblicazione: (2024)

Generative Fuzzy System for Sequence Generation
di: Yang, Hailong, et al.
Pubblicazione: (2024)

Generalized Preference Optimization: A Unified Approach to Offline Alignment
di: Tang, Yunhao, et al.
Pubblicazione: (2024)

Generative Distribution Prediction: A Unified Approach to Multimodal Learning
di: Tian, Xinyu, et al.
Pubblicazione: (2025)

KV Admission: Learning What to Write for Efficient Long-Context Inference
di: Huang, Yen-Chieh, et al.
Pubblicazione: (2025)

Generative AI for Controllable Protein Sequence Design: A Survey
di: Zhu, Yiheng, et al.
Pubblicazione: (2024)

Generative Diffusion Prior Distillation for Long-Context Knowledge Transfer
di: Udayangani, Nilushika, et al.
Pubblicazione: (2026)

MOM: Memory-Efficient Offloaded Mini-Sequence Inference for Long Context Language Models
di: Zhang, Junyang, et al.
Pubblicazione: (2025)

TRISKELION-1: Unified Descriptive-Predictive-Generative AI
di: Kumar, Nardeep, et al.
Pubblicazione: (2025)

StreamBP: Memory-Efficient Exact Backpropagation for Long Sequence Training of LLMs
di: Luo, Qijun, et al.
Pubblicazione: (2025)

Parallel Structures in Pre-training Data Yield In-Context Learning
di: Chen, Yanda, et al.
Pubblicazione: (2024)

Long Input Sequence Network for Long Time Series Forecasting
di: Ma, Chao, et al.
Pubblicazione: (2024)

Efficient Low Rank Attention for Long-Context Inference in Large Language Models
di: Li, Tenghui, et al.
Pubblicazione: (2025)

ParaDySe: A Parallel-Strategy Switching Framework for Dynamic Sequence Lengths in Transformer
di: Ou, Zhixin, et al.
Pubblicazione: (2025)

Long Context In-Context Compression by Getting to the Gist of Gisting
di: Petrov, Aleksandar, et al.
Pubblicazione: (2025)

Baguan-TS: A Sequence-Native In-Context Learning Model for Time Series Forecasting with Covariates
di: Yang, Linxiao, et al.
Pubblicazione: (2026)

Scaling Laws and In-Context Learning: A Unified Theoretical Framework
di: Mehta, Sushant, et al.
Pubblicazione: (2025)

Technical Debt in In-Context Learning: Diminishing Efficiency in Long Context
di: Joo, Taejong, et al.
Pubblicazione: (2025)

Artificial Hippocampus Networks for Efficient Long-Context Modeling
di: Fang, Yunhao, et al.
Pubblicazione: (2025)

Context-Former: Stitching via Latent Conditioned Sequence Modeling
di: Zhang, Ziqi, et al.
Pubblicazione: (2024)

Gradient Flow Drifting: Generative Modeling via Wasserstein Gradient Flows of KDE-Approximated Divergences
di: Cao, Jiarui, et al.
Pubblicazione: (2026)

UFO: A Unified Flow-Oriented Framework for Robust Continual Graph Learning
di: Zhang, Danhui, et al.
Pubblicazione: (2026)

UniGEM: A Unified Approach to Generation and Property Prediction for Molecules
di: Feng, Shikun, et al.
Pubblicazione: (2024)

High-order Knowledge Based Network Controllability Robustness Prediction: A Hypergraph Neural Network Approach
di: Mo, Shibing, et al.
Pubblicazione: (2026)

Block-Biased Mamba for Long-Range Sequence Processing
di: Yu, Annan, et al.
Pubblicazione: (2025)

AI Pangaea: Unifying Intelligence Islands for Adapting Myriad Tasks
di: Chang, Jianlong, et al.
Pubblicazione: (2025)

TracLLM: A Generic Framework for Attributing Long Context LLMs
di: Wang, Yanting, et al.
Pubblicazione: (2025)

From Classical Probabilistic Latent Variable Models to Modern Generative AI: A Unified Perspective
di: Chen, Tianhua
Pubblicazione: (2025)

DMax: Aggressive Parallel Decoding for dLLMs
di: Chen, Zigeng, et al.
Pubblicazione: (2026)

The PokeAgent Challenge: Competitive and Long-Context Learning at Scale
di: Karten, Seth, et al.
Pubblicazione: (2026)