Enregistré dans:
| Auteurs principaux: | Xu, Haoren, Fang, Guanhua |
|---|---|
| Format: | Preprint |
| Publié: |
2026
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2605.10466 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
Multi-Item-Query Attention for Stable Sequential Recommendation
par: Xu, Mingshi, et autres
Publié: (2025)
par: Xu, Mingshi, et autres
Publié: (2025)
Transformers as Unsupervised Learning Algorithms: A study on Gaussian Mixtures
par: Chen, Zhiheng, et autres
Publié: (2025)
par: Chen, Zhiheng, et autres
Publié: (2025)
Unifying Perplexing Behaviors in Modified BP Attributions through Alignment Perspective
par: Zheng, Guanhua, et autres
Publié: (2025)
par: Zheng, Guanhua, et autres
Publié: (2025)
Learning under Commission and Omission Event Outliers
par: Zhang, Yuecheng, et autres
Publié: (2025)
par: Zhang, Yuecheng, et autres
Publié: (2025)
On Non-asymptotic Theory of Recurrent Neural Networks in Temporal Point Processes
par: Chen, Zhiheng, et autres
Publié: (2024)
par: Chen, Zhiheng, et autres
Publié: (2024)
General and Estimable Learning Bound Unifying Covariate and Concept Shifts
par: Chen, Hongbo, et autres
Publié: (2025)
par: Chen, Hongbo, et autres
Publié: (2025)
Self-Supervised Learning for Covariance Estimation
par: Diskin, Tzvi, et autres
Publié: (2024)
par: Diskin, Tzvi, et autres
Publié: (2024)
Continual Learning in the Presence of Repetition
par: Hemati, Hamed, et autres
Publié: (2024)
par: Hemati, Hamed, et autres
Publié: (2024)
Context-Enhanced Multi-View Trajectory Representation Learning: Bridging the Gap through Self-Supervised Models
par: Qian, Tangwen, et autres
Publié: (2024)
par: Qian, Tangwen, et autres
Publié: (2024)
Zero-Shot Time Series Forecasting with Covariates via In-Context Learning
par: Auer, Andreas, et autres
Publié: (2025)
par: Auer, Andreas, et autres
Publié: (2025)
Self-Attention as Distributional Projection: A Unified Interpretation of Transformer Architecture
par: Mehta, Nihal
Publié: (2025)
par: Mehta, Nihal
Publié: (2025)
Self-Supervised Learning for Neural Topic Models with Variance-Invariance-Covariance Regularization
par: Xu, Weiran, et autres
Publié: (2025)
par: Xu, Weiran, et autres
Publié: (2025)
Contrastive Graph Condensation: Advancing Data Versatility through Self-Supervised Learning
par: Gao, Xinyi, et autres
Publié: (2024)
par: Gao, Xinyi, et autres
Publié: (2024)
Unifying Sparse Attention with Hierarchical Memory for Scalable Long-Context LLM Serving
par: Zhao, Zihan, et autres
Publié: (2026)
par: Zhao, Zihan, et autres
Publié: (2026)
Attention as In-Context Empirical Bayes: A Two-Stage View via Particle Dynamics
par: Smart, Matthew, et autres
Publié: (2026)
par: Smart, Matthew, et autres
Publié: (2026)
Baguan-TS: A Sequence-Native In-Context Learning Model for Time Series Forecasting with Covariates
par: Yang, Linxiao, et autres
Publié: (2026)
par: Yang, Linxiao, et autres
Publié: (2026)
USP: A Unified Sequence Parallelism Approach for Long Context Generative AI
par: Fang, Jiarui, et autres
Publié: (2024)
par: Fang, Jiarui, et autres
Publié: (2024)
Are Independently Estimated View Uncertainties Comparable? Unified Routing for Trusted Multi-View Classification
par: Zhang, Yilin, et autres
Publié: (2026)
par: Zhang, Yilin, et autres
Publié: (2026)
Learning Repetition-Invariant Representations for Polymer Informatics
par: Zhu, Yihan, et autres
Publié: (2025)
par: Zhu, Yihan, et autres
Publié: (2025)
Analyzing and Mitigating Repetitions in Trip Recommendation
par: Shu, Wenzheng, et autres
Publié: (2025)
par: Shu, Wenzheng, et autres
Publié: (2025)
Training Dynamics of In-Context Learning in Linear Attention
par: Zhang, Yedi, et autres
Publié: (2025)
par: Zhang, Yedi, et autres
Publié: (2025)
Datasets, Documents, and Repetitions: The Practicalities of Unequal Data Quality
par: Fang, Alex, et autres
Publié: (2025)
par: Fang, Alex, et autres
Publié: (2025)
CodeSAM: Source Code Representation Learning by Infusing Self-Attention with Multi-Code-View Graphs
par: Mathai, Alex, et autres
Publié: (2024)
par: Mathai, Alex, et autres
Publié: (2024)
A Unified View on Solving Objective Mismatch in Model-Based Reinforcement Learning
par: Wei, Ran, et autres
Publié: (2023)
par: Wei, Ran, et autres
Publié: (2023)
Self-Attention Mechanism in Multimodal Context for Banking Transaction Flow
par: Delestre, Cyrile, et autres
Publié: (2024)
par: Delestre, Cyrile, et autres
Publié: (2024)
GGBall: Graph Generative Model on Poincaré Ball
par: Bu, Tianci, et autres
Publié: (2025)
par: Bu, Tianci, et autres
Publié: (2025)
SPECTRE: An FFT-Based Efficient Drop-In Replacement to Self-Attention for Long Contexts
par: Fein-Ashley, Jacob, et autres
Publié: (2025)
par: Fein-Ashley, Jacob, et autres
Publié: (2025)
MCCE: Missingness-aware Causal Concept Explainer
par: Gao, Jifan, et autres
Publié: (2024)
par: Gao, Jifan, et autres
Publié: (2024)
Inherent Trade-Offs between Diversity and Stability in Multi-Task Benchmarks
par: Zhang, Guanhua, et autres
Publié: (2024)
par: Zhang, Guanhua, et autres
Publié: (2024)
On Understanding Attention-Based In-Context Learning for Categorical Data
par: Wang, Aaron T., et autres
Publié: (2024)
par: Wang, Aaron T., et autres
Publié: (2024)
Breaking Symmetry Bottlenecks in GNN Readouts
par: Talhi, Mouad, et autres
Publié: (2026)
par: Talhi, Mouad, et autres
Publié: (2026)
Non-Equilibrium Stochastic Dynamics as a Unified Framework for Insight and Repetitive Learning: A Kramers Escape Approach to Continual Learning
par: Kim, Gunn
Publié: (2026)
par: Kim, Gunn
Publié: (2026)
ID and Graph View Contrastive Learning with Multi-View Attention Fusion for Sequential Recommendation
par: Zhou, Xiaofan, et autres
Publié: (2026)
par: Zhou, Xiaofan, et autres
Publié: (2026)
From GARCH to Neural Network for Volatility Forecast
par: Zhao, Pengfei, et autres
Publié: (2024)
par: Zhao, Pengfei, et autres
Publié: (2024)
Retrieval Backward Attention without Additional Training: Enhance Embeddings of Large Language Models via Repetition
par: Duan, Yifei, et autres
Publié: (2025)
par: Duan, Yifei, et autres
Publié: (2025)
Double Self-weighted Multi-view Clustering via Adaptive View Fusion
par: Fang, Xiang, et autres
Publié: (2020)
par: Fang, Xiang, et autres
Publié: (2020)
Scaling Laws and In-Context Learning: A Unified Theoretical Framework
par: Mehta, Sushant, et autres
Publié: (2025)
par: Mehta, Sushant, et autres
Publié: (2025)
Sketching the Readout of Large Language Models for Scalable Data Attribution and Valuation
par: Ran, Yide, et autres
Publié: (2026)
par: Ran, Yide, et autres
Publié: (2026)
Unified View Imputation and Feature Selection Learning for Incomplete Multi-view Data
par: Huang, Yanyong, et autres
Publié: (2024)
par: Huang, Yanyong, et autres
Publié: (2024)
Iterative Amortized Inference: Unifying In-Context Learning and Learned Optimizers
par: Mittal, Sarthak, et autres
Publié: (2025)
par: Mittal, Sarthak, et autres
Publié: (2025)
Documents similaires
-
Multi-Item-Query Attention for Stable Sequential Recommendation
par: Xu, Mingshi, et autres
Publié: (2025) -
Transformers as Unsupervised Learning Algorithms: A study on Gaussian Mixtures
par: Chen, Zhiheng, et autres
Publié: (2025) -
Unifying Perplexing Behaviors in Modified BP Attributions through Alignment Perspective
par: Zheng, Guanhua, et autres
Publié: (2025) -
Learning under Commission and Omission Event Outliers
par: Zhang, Yuecheng, et autres
Publié: (2025) -
On Non-asymptotic Theory of Recurrent Neural Networks in Temporal Point Processes
par: Chen, Zhiheng, et autres
Publié: (2024)