:: Library Catalog

Buchumschlag

Gespeichert in:

Bibliographische Detailangaben
Hauptverfasser:	Lv, Qi, Deng, Xiang, Chen, Gongwei, Wang, Michael Yu, Nie, Liqiang
Format:	Preprint
Veröffentlicht:	2024
Schlagworte:	Machine Learning
Online-Zugang:	https://arxiv.org/abs/2406.05427
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Ähnliche Einträge

Decision MetaMamba: Enhancing Selective SSM in Offline RL with Heterogeneous Sequence Mixing
von: Kim, Wall, et al.
Veröffentlicht: (2026)

Decision MetaMamba: Enhancing Selective SSM in Offline RL with Heterogeneous Sequence Mixing
von: Kim, Wall, et al.
Veröffentlicht: (2024)

Mamba as Decision Maker: Exploring Multi-scale Sequence Modeling in Offline Reinforcement Learning
von: Cao, Jiahang, et al.
Veröffentlicht: (2024)

Learning to Trust Bellman Updates: Selective State-Adaptive Regularization for Offline RL
von: Luo, Qin-Wen, et al.
Veröffentlicht: (2025)

PersonalAlign: Hierarchical Implicit Intent Alignment for Personalized GUI Agent with Long-Term User-Centric Records
von: Lyu, Yibo, et al.
Veröffentlicht: (2026)

Spatial-Temporal Graph Diffusion Policy with Kinematic Modeling for Bimanual Robotic Manipulation
von: Lv, Qi, et al.
Veröffentlicht: (2025)

Boost Post-Training Quantization via Null Space Optimization for Large Language Models
von: Zhao, Jiaqi, et al.
Veröffentlicht: (2025)

STAR: Learning Diverse Robot Skill Abstractions through Rotation-Augmented Vector Quantization
von: Li, Hao, et al.
Veröffentlicht: (2025)

KalMamba: Towards Efficient Probabilistic State Space Models for RL under Uncertainty
von: Becker, Philipp, et al.
Veröffentlicht: (2024)

Making Offline RL Online: Collaborative World Models for Offline Visual Reinforcement Learning
von: Wang, Qi, et al.
Veröffentlicht: (2023)

The Role of Deep Learning Regularizations on Actors in Offline RL
von: Tarasov, Denis, et al.
Veröffentlicht: (2024)

Don't Trade Off Safety: Diffusion Regularization for Constrained Offline RL
von: Guo, Junyu, et al.
Veröffentlicht: (2025)

Trained Mamba Emulates Online Gradient Descent in In-Context Linear Regression
von: Jiang, Jiarui, et al.
Veröffentlicht: (2025)

Decision Mamba: Reinforcement Learning via Sequence Modeling with Selective State Spaces
von: Ota, Toshihiro
Veröffentlicht: (2024)

Q-value Regularized Decision ConvFormer for Offline Reinforcement Learning
von: Yan, Teng, et al.
Veröffentlicht: (2024)

Less is More: Clustered Cross-Covariance Control for Offline RL
von: Qiao, Nan, et al.
Veröffentlicht: (2026)

An Empirical Study on the Effectiveness of Incorporating Offline RL As Online RL Subroutines
von: Su, Jianhai, et al.
Veröffentlicht: (2025)

Mitigating Distribution Shift in Model-based Offline RL via Shifts-aware Reward Learning
von: Luo, Wang, et al.
Veröffentlicht: (2024)

Swimba: Switch Mamba Model Scales State Space Models
von: Du, Zhixu, et al.
Veröffentlicht: (2026)

EPD: Long-term Memory Extraction, Context-awared Planning and Multi-iteration Decision @ EgoPlan Challenge ICML 2024
von: Shi, Letian, et al.
Veröffentlicht: (2024)

Solving Continual Offline RL through Selective Weights Activation on Aligned Spaces
von: Hu, Jifeng, et al.
Veröffentlicht: (2024)

Reinformer: Max-Return Sequence Modeling for Offline RL
von: Zhuang, Zifeng, et al.
Veröffentlicht: (2024)

Are Expressive Models Truly Necessary for Offline RL?
von: Wang, Guan, et al.
Veröffentlicht: (2024)

Mamba-3: Improved Sequence Modeling using State Space Principles
von: Lahoti, Aakash, et al.
Veröffentlicht: (2026)

Tractable Offline Learning of Regular Decision Processes
von: Deb, Ahana, et al.
Veröffentlicht: (2024)

Regularity of Second-Order Elliptic PDEs in Spectral Barron Spaces
von: Chen, Ziang, et al.
Veröffentlicht: (2026)

PerfMamba: Performance Analysis and Pruning of Selective State Space Models
von: Asif, Abdullah Al, et al.
Veröffentlicht: (2025)

SSAMBA: Self-Supervised Audio Representation Learning with Mamba State Space Model
von: Shams, Siavash, et al.
Veröffentlicht: (2024)

MemMamba: Rethinking Memory Patterns in State Space Model
von: Wang, Youjin, et al.
Veröffentlicht: (2025)

Toward Explainable Offline RL: Analyzing Representations in Intrinsically Motivated Decision Transformers
von: Guiducci, Leonardo, et al.
Veröffentlicht: (2025)

SurvMamba: State Space Model with Multi-grained Multi-modal Interaction for Survival Prediction
von: Chen, Ying, et al.
Veröffentlicht: (2024)

Meta-DT: Offline Meta-RL as Conditional Sequence Modeling with World Model Disentanglement
von: Wang, Zhi, et al.
Veröffentlicht: (2024)

Offline Multi-task Transfer RL with Representational Penalization
von: Bose, Avinandan, et al.
Veröffentlicht: (2024)

Advancing Intelligent Sequence Modeling: Evolution, Trade-offs, and Applications of State- Space Architectures from S4 to Mamba
von: Somvanshi, Shriyank, et al.
Veröffentlicht: (2025)

Less is More: Empowering GUI Agent with Context-Aware Simplification
von: Chen, Gongwei, et al.
Veröffentlicht: (2025)

FREPix: Frequency-Heterogeneous Flow Matching for Pixel-Space Image Generation
von: Lin, Mingfeng, et al.
Veröffentlicht: (2026)

Federated Offline Policy Optimization with Dual Regularization
von: Yue, Sheng, et al.
Veröffentlicht: (2024)

MambaByte: Token-free Selective State Space Model
von: Wang, Junxiong, et al.
Veröffentlicht: (2024)

Scaling Offline Model-Based RL via Jointly-Optimized World-Action Model Pretraining
von: Cheng, Jie, et al.
Veröffentlicht: (2024)

Augmenting Offline RL with Unlabeled Data
von: Wang, Zhao, et al.
Veröffentlicht: (2024)