Gespeichert in:
| Hauptverfasser: | Lv, Qi, Deng, Xiang, Chen, Gongwei, Wang, Michael Yu, Nie, Liqiang |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2024
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2406.05427 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
Decision MetaMamba: Enhancing Selective SSM in Offline RL with Heterogeneous Sequence Mixing
von: Kim, Wall, et al.
Veröffentlicht: (2026)
von: Kim, Wall, et al.
Veröffentlicht: (2026)
Decision MetaMamba: Enhancing Selective SSM in Offline RL with Heterogeneous Sequence Mixing
von: Kim, Wall, et al.
Veröffentlicht: (2024)
von: Kim, Wall, et al.
Veröffentlicht: (2024)
Mamba as Decision Maker: Exploring Multi-scale Sequence Modeling in Offline Reinforcement Learning
von: Cao, Jiahang, et al.
Veröffentlicht: (2024)
von: Cao, Jiahang, et al.
Veröffentlicht: (2024)
Learning to Trust Bellman Updates: Selective State-Adaptive Regularization for Offline RL
von: Luo, Qin-Wen, et al.
Veröffentlicht: (2025)
von: Luo, Qin-Wen, et al.
Veröffentlicht: (2025)
PersonalAlign: Hierarchical Implicit Intent Alignment for Personalized GUI Agent with Long-Term User-Centric Records
von: Lyu, Yibo, et al.
Veröffentlicht: (2026)
von: Lyu, Yibo, et al.
Veröffentlicht: (2026)
Spatial-Temporal Graph Diffusion Policy with Kinematic Modeling for Bimanual Robotic Manipulation
von: Lv, Qi, et al.
Veröffentlicht: (2025)
von: Lv, Qi, et al.
Veröffentlicht: (2025)
Boost Post-Training Quantization via Null Space Optimization for Large Language Models
von: Zhao, Jiaqi, et al.
Veröffentlicht: (2025)
von: Zhao, Jiaqi, et al.
Veröffentlicht: (2025)
STAR: Learning Diverse Robot Skill Abstractions through Rotation-Augmented Vector Quantization
von: Li, Hao, et al.
Veröffentlicht: (2025)
von: Li, Hao, et al.
Veröffentlicht: (2025)
KalMamba: Towards Efficient Probabilistic State Space Models for RL under Uncertainty
von: Becker, Philipp, et al.
Veröffentlicht: (2024)
von: Becker, Philipp, et al.
Veröffentlicht: (2024)
Making Offline RL Online: Collaborative World Models for Offline Visual Reinforcement Learning
von: Wang, Qi, et al.
Veröffentlicht: (2023)
von: Wang, Qi, et al.
Veröffentlicht: (2023)
The Role of Deep Learning Regularizations on Actors in Offline RL
von: Tarasov, Denis, et al.
Veröffentlicht: (2024)
von: Tarasov, Denis, et al.
Veröffentlicht: (2024)
Don't Trade Off Safety: Diffusion Regularization for Constrained Offline RL
von: Guo, Junyu, et al.
Veröffentlicht: (2025)
von: Guo, Junyu, et al.
Veröffentlicht: (2025)
Trained Mamba Emulates Online Gradient Descent in In-Context Linear Regression
von: Jiang, Jiarui, et al.
Veröffentlicht: (2025)
von: Jiang, Jiarui, et al.
Veröffentlicht: (2025)
Decision Mamba: Reinforcement Learning via Sequence Modeling with Selective State Spaces
von: Ota, Toshihiro
Veröffentlicht: (2024)
von: Ota, Toshihiro
Veröffentlicht: (2024)
Q-value Regularized Decision ConvFormer for Offline Reinforcement Learning
von: Yan, Teng, et al.
Veröffentlicht: (2024)
von: Yan, Teng, et al.
Veröffentlicht: (2024)
Less is More: Clustered Cross-Covariance Control for Offline RL
von: Qiao, Nan, et al.
Veröffentlicht: (2026)
von: Qiao, Nan, et al.
Veröffentlicht: (2026)
An Empirical Study on the Effectiveness of Incorporating Offline RL As Online RL Subroutines
von: Su, Jianhai, et al.
Veröffentlicht: (2025)
von: Su, Jianhai, et al.
Veröffentlicht: (2025)
Mitigating Distribution Shift in Model-based Offline RL via Shifts-aware Reward Learning
von: Luo, Wang, et al.
Veröffentlicht: (2024)
von: Luo, Wang, et al.
Veröffentlicht: (2024)
Swimba: Switch Mamba Model Scales State Space Models
von: Du, Zhixu, et al.
Veröffentlicht: (2026)
von: Du, Zhixu, et al.
Veröffentlicht: (2026)
EPD: Long-term Memory Extraction, Context-awared Planning and Multi-iteration Decision @ EgoPlan Challenge ICML 2024
von: Shi, Letian, et al.
Veröffentlicht: (2024)
von: Shi, Letian, et al.
Veröffentlicht: (2024)
Solving Continual Offline RL through Selective Weights Activation on Aligned Spaces
von: Hu, Jifeng, et al.
Veröffentlicht: (2024)
von: Hu, Jifeng, et al.
Veröffentlicht: (2024)
Reinformer: Max-Return Sequence Modeling for Offline RL
von: Zhuang, Zifeng, et al.
Veröffentlicht: (2024)
von: Zhuang, Zifeng, et al.
Veröffentlicht: (2024)
Are Expressive Models Truly Necessary for Offline RL?
von: Wang, Guan, et al.
Veröffentlicht: (2024)
von: Wang, Guan, et al.
Veröffentlicht: (2024)
Mamba-3: Improved Sequence Modeling using State Space Principles
von: Lahoti, Aakash, et al.
Veröffentlicht: (2026)
von: Lahoti, Aakash, et al.
Veröffentlicht: (2026)
Tractable Offline Learning of Regular Decision Processes
von: Deb, Ahana, et al.
Veröffentlicht: (2024)
von: Deb, Ahana, et al.
Veröffentlicht: (2024)
Regularity of Second-Order Elliptic PDEs in Spectral Barron Spaces
von: Chen, Ziang, et al.
Veröffentlicht: (2026)
von: Chen, Ziang, et al.
Veröffentlicht: (2026)
PerfMamba: Performance Analysis and Pruning of Selective State Space Models
von: Asif, Abdullah Al, et al.
Veröffentlicht: (2025)
von: Asif, Abdullah Al, et al.
Veröffentlicht: (2025)
SSAMBA: Self-Supervised Audio Representation Learning with Mamba State Space Model
von: Shams, Siavash, et al.
Veröffentlicht: (2024)
von: Shams, Siavash, et al.
Veröffentlicht: (2024)
MemMamba: Rethinking Memory Patterns in State Space Model
von: Wang, Youjin, et al.
Veröffentlicht: (2025)
von: Wang, Youjin, et al.
Veröffentlicht: (2025)
Toward Explainable Offline RL: Analyzing Representations in Intrinsically Motivated Decision Transformers
von: Guiducci, Leonardo, et al.
Veröffentlicht: (2025)
von: Guiducci, Leonardo, et al.
Veröffentlicht: (2025)
SurvMamba: State Space Model with Multi-grained Multi-modal Interaction for Survival Prediction
von: Chen, Ying, et al.
Veröffentlicht: (2024)
von: Chen, Ying, et al.
Veröffentlicht: (2024)
Meta-DT: Offline Meta-RL as Conditional Sequence Modeling with World Model Disentanglement
von: Wang, Zhi, et al.
Veröffentlicht: (2024)
von: Wang, Zhi, et al.
Veröffentlicht: (2024)
Offline Multi-task Transfer RL with Representational Penalization
von: Bose, Avinandan, et al.
Veröffentlicht: (2024)
von: Bose, Avinandan, et al.
Veröffentlicht: (2024)
Advancing Intelligent Sequence Modeling: Evolution, Trade-offs, and Applications of State- Space Architectures from S4 to Mamba
von: Somvanshi, Shriyank, et al.
Veröffentlicht: (2025)
von: Somvanshi, Shriyank, et al.
Veröffentlicht: (2025)
Less is More: Empowering GUI Agent with Context-Aware Simplification
von: Chen, Gongwei, et al.
Veröffentlicht: (2025)
von: Chen, Gongwei, et al.
Veröffentlicht: (2025)
FREPix: Frequency-Heterogeneous Flow Matching for Pixel-Space Image Generation
von: Lin, Mingfeng, et al.
Veröffentlicht: (2026)
von: Lin, Mingfeng, et al.
Veröffentlicht: (2026)
Federated Offline Policy Optimization with Dual Regularization
von: Yue, Sheng, et al.
Veröffentlicht: (2024)
von: Yue, Sheng, et al.
Veröffentlicht: (2024)
MambaByte: Token-free Selective State Space Model
von: Wang, Junxiong, et al.
Veröffentlicht: (2024)
von: Wang, Junxiong, et al.
Veröffentlicht: (2024)
Scaling Offline Model-Based RL via Jointly-Optimized World-Action Model Pretraining
von: Cheng, Jie, et al.
Veröffentlicht: (2024)
von: Cheng, Jie, et al.
Veröffentlicht: (2024)
Augmenting Offline RL with Unlabeled Data
von: Wang, Zhao, et al.
Veröffentlicht: (2024)
von: Wang, Zhao, et al.
Veröffentlicht: (2024)
Ähnliche Einträge
-
Decision MetaMamba: Enhancing Selective SSM in Offline RL with Heterogeneous Sequence Mixing
von: Kim, Wall, et al.
Veröffentlicht: (2026) -
Decision MetaMamba: Enhancing Selective SSM in Offline RL with Heterogeneous Sequence Mixing
von: Kim, Wall, et al.
Veröffentlicht: (2024) -
Mamba as Decision Maker: Exploring Multi-scale Sequence Modeling in Offline Reinforcement Learning
von: Cao, Jiahang, et al.
Veröffentlicht: (2024) -
Learning to Trust Bellman Updates: Selective State-Adaptive Regularization for Offline RL
von: Luo, Qin-Wen, et al.
Veröffentlicht: (2025) -
PersonalAlign: Hierarchical Implicit Intent Alignment for Personalized GUI Agent with Long-Term User-Centric Records
von: Lyu, Yibo, et al.
Veröffentlicht: (2026)