Enregistré dans:
| Auteur principal: | Racioppo, Peter |
|---|---|
| Format: | Preprint |
| Publié: |
2026
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2605.11007 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
Robust Filter Attention: Self-Attention as Precision-Weighted State Estimation
par: Racioppo, Peter
Publié: (2025)
par: Racioppo, Peter
Publié: (2025)
Equivariant Spherical Transformer for Efficient Molecular Modeling
par: An, Junyi, et autres
Publié: (2025)
par: An, Junyi, et autres
Publié: (2025)
AC-SINDy: Compositional Sparse Identification of Nonlinear Dynamics
par: Racioppo, Peter
Publié: (2026)
par: Racioppo, Peter
Publié: (2026)
SparseSwin: Swin Transformer with Sparse Transformer Block
par: Pinasthika, Krisna, et autres
Publié: (2023)
par: Pinasthika, Krisna, et autres
Publié: (2023)
BlockCert: Certified Blockwise Extraction of Transformer Mechanisms
par: Andric, Sandro
Publié: (2025)
par: Andric, Sandro
Publié: (2025)
Transformer Block Coupling and its Correlation with Generalization in LLMs
par: Aubry, Murdock, et autres
Publié: (2024)
par: Aubry, Murdock, et autres
Publié: (2024)
Block-Recurrent Dynamics in Vision Transformers
par: Jacobs, Mozes, et autres
Publié: (2025)
par: Jacobs, Mozes, et autres
Publié: (2025)
OrthoFormer: Instrumental Variable Estimation in Transformer Hidden States via Neural Control Functions
par: Luo, Charles
Publié: (2026)
par: Luo, Charles
Publié: (2026)
Block Transformer: Global-to-Local Language Modeling for Fast Inference
par: Ho, Namgyu, et autres
Publié: (2024)
par: Ho, Namgyu, et autres
Publié: (2024)
The Belief State Transformer
par: Hu, Edward S., et autres
Publié: (2024)
par: Hu, Edward S., et autres
Publié: (2024)
Consciousness-ECG Transformer for Conscious State Estimation System with Real-Time Monitoring
par: Kweon, Young-Seok, et autres
Publié: (2025)
par: Kweon, Young-Seok, et autres
Publié: (2025)
Relational Preference Encoding in Looped Transformer Internal States
par: Kirin, Jan
Publié: (2026)
par: Kirin, Jan
Publié: (2026)
MeSH: Memory-as-State-Highways for Recursive Transformers
par: Yu, Chengting, et autres
Publié: (2025)
par: Yu, Chengting, et autres
Publié: (2025)
On the Role of Hidden States of Modern Hopfield Network in Transformer
par: Masumura, Tsubasa, et autres
Publié: (2025)
par: Masumura, Tsubasa, et autres
Publié: (2025)
Echo State Transformer: Attention Over Finite Memories
par: Bendi-Ouis, Yannis, et autres
Publié: (2025)
par: Bendi-Ouis, Yannis, et autres
Publié: (2025)
Spatial Transformers for Radio Map Estimation
par: Viet, Pham Q., et autres
Publié: (2024)
par: Viet, Pham Q., et autres
Publié: (2024)
Circuits, Features, and Heuristics in Molecular Transformers
par: Varadi, Kristof, et autres
Publié: (2025)
par: Varadi, Kristof, et autres
Publié: (2025)
ReplaceMe: Network Simplification via Depth Pruning and Transformer Block Linearization
par: Shopkhoev, Dmitriy, et autres
Publié: (2025)
par: Shopkhoev, Dmitriy, et autres
Publié: (2025)
Transformer-Based Spatial-Temporal Counterfactual Outcomes Estimation
par: Li, He, et autres
Publié: (2025)
par: Li, He, et autres
Publié: (2025)
Conformal Transformations for Symmetric Power Transformers
par: Kumar, Saurabh, et autres
Publié: (2025)
par: Kumar, Saurabh, et autres
Publié: (2025)
Predicting Human Brain States with Transformer
par: Sun, Yifei, et autres
Publié: (2024)
par: Sun, Yifei, et autres
Publié: (2024)
SGAT4PASS: Spherical Geometry-Aware Transformer for PAnoramic Semantic Segmentation
par: Li, Xuewei, et autres
Publié: (2023)
par: Li, Xuewei, et autres
Publié: (2023)
Scale-Consistent State-Space Dynamics via Fractal of Stationary Transformations
par: Yu, Geunhyeok, et autres
Publié: (2026)
par: Yu, Geunhyeok, et autres
Publié: (2026)
Priming: Hybrid State Space Models From Pre-trained Transformers
par: Chattopadhyay, Aditya, et autres
Publié: (2026)
par: Chattopadhyay, Aditya, et autres
Publié: (2026)
Value-State Gated Attention for Mitigating Extreme-Token Phenomena in Transformers
par: Bu, Rui, et autres
Publié: (2025)
par: Bu, Rui, et autres
Publié: (2025)
SEA: State-Exchange Attention for High-Fidelity Physics Based Transformers
par: Esmati, Parsa, et autres
Publié: (2024)
par: Esmati, Parsa, et autres
Publié: (2024)
Predicting Estimated Times of Restoration for Electrical Outages Using Longitudinal Tabular Transformers
par: Teja, Bogireddy Sai Prasanna, et autres
Publié: (2025)
par: Teja, Bogireddy Sai Prasanna, et autres
Publié: (2025)
ACTIVA: Amortized Causal Effect Estimation via Transformer-based Variational Autoencoder
par: Sauter, Andreas, et autres
Publié: (2025)
par: Sauter, Andreas, et autres
Publié: (2025)
TOAST: Transformer Optimization using Adaptive and Simple Transformations
par: Cannistraci, Irene, et autres
Publié: (2024)
par: Cannistraci, Irene, et autres
Publié: (2024)
Provably Optimal Memory Capacity for Modern Hopfield Models: Transformer-Compatible Dense Associative Memories as Spherical Codes
par: Hu, Jerry Yao-Chieh, et autres
Publié: (2024)
par: Hu, Jerry Yao-Chieh, et autres
Publié: (2024)
An Introduction to Transformers
par: Turner, Richard E.
Publié: (2023)
par: Turner, Richard E.
Publié: (2023)
Traj-Transformer: Diffusion Models with Transformer for GPS Trajectory Generation
par: Zhang, Zhiyang, et autres
Publié: (2025)
par: Zhang, Zhiyang, et autres
Publié: (2025)
Are Transformers More Robust? Towards Exact Robustness Verification for Transformers
par: Liao, Brian Hsuan-Cheng, et autres
Publié: (2022)
par: Liao, Brian Hsuan-Cheng, et autres
Publié: (2022)
RESCHED: Rethinking Flexible Job Shop Scheduling from a Transformer-based Architecture with Simplified States
par: Xiao, Xiangjie, et autres
Publié: (2026)
par: Xiao, Xiangjie, et autres
Publié: (2026)
FOAM: Blocked State Folding for Memory-Efficient LLM Training
par: Wen, Ziqing, et autres
Publié: (2025)
par: Wen, Ziqing, et autres
Publié: (2025)
EnTransformer: A Deep Generative Transformer for Multivariate Probabilistic Forecasting
par: Pathak, Rajdeep, et autres
Publié: (2026)
par: Pathak, Rajdeep, et autres
Publié: (2026)
Transformer Is Inherently a Causal Learner
par: Wang, Xinyue, et autres
Publié: (2026)
par: Wang, Xinyue, et autres
Publié: (2026)
Evidential Transformation Network: Turning Pretrained Models into Evidential Models for Post-hoc Uncertainty Estimation
par: Chun, Yongchan, et autres
Publié: (2026)
par: Chun, Yongchan, et autres
Publié: (2026)
Self-Clustering Graph Transformer Approach to Model Resting-State Functional Brain Activity
par: Thapaliya, Bishal, et autres
Publié: (2025)
par: Thapaliya, Bishal, et autres
Publié: (2025)
EnergyPatchTST: Multi-scale Time Series Transformers with Uncertainty Estimation for Energy Forecasting
par: Li, Wei, et autres
Publié: (2025)
par: Li, Wei, et autres
Publié: (2025)
Documents similaires
-
Robust Filter Attention: Self-Attention as Precision-Weighted State Estimation
par: Racioppo, Peter
Publié: (2025) -
Equivariant Spherical Transformer for Efficient Molecular Modeling
par: An, Junyi, et autres
Publié: (2025) -
AC-SINDy: Compositional Sparse Identification of Nonlinear Dynamics
par: Racioppo, Peter
Publié: (2026) -
SparseSwin: Swin Transformer with Sparse Transformer Block
par: Pinasthika, Krisna, et autres
Publié: (2023) -
BlockCert: Certified Blockwise Extraction of Transformer Mechanisms
par: Andric, Sandro
Publié: (2025)