Gespeichert in:
| Hauptverfasser: | Zhang, Chi, Jia, Ziying, Atia, George K., He, Sihong, Wang, Yue |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2025
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2505.18447 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
CADENT: Gated Hybrid Distillation for Sample-Efficient Transfer in Reinforcement Learning
von: Alinejad, Mahyar, et al.
Veröffentlicht: (2026)
von: Alinejad, Mahyar, et al.
Veröffentlicht: (2026)
Provably Sample-Efficient Robust Reinforcement Learning with Average Reward
von: Roch, Zachary, et al.
Veröffentlicht: (2025)
von: Roch, Zachary, et al.
Veröffentlicht: (2025)
Online Robust Reinforcement Learning with General Function Approximation
von: Ghosh, Debamita, et al.
Veröffentlicht: (2025)
von: Ghosh, Debamita, et al.
Veröffentlicht: (2025)
ORVIT: Near-Optimal Online Distributionally Robust Reinforcement Learning
von: Ghosh, Debamita, et al.
Veröffentlicht: (2025)
von: Ghosh, Debamita, et al.
Veröffentlicht: (2025)
Robust Transfer Learning with Side Information
von: Awad, Akram S., et al.
Veröffentlicht: (2026)
von: Awad, Akram S., et al.
Veröffentlicht: (2026)
RLAF: Reinforcement Learning from Automaton Feedback
von: Alinejad, Mahyar, et al.
Veröffentlicht: (2025)
von: Alinejad, Mahyar, et al.
Veröffentlicht: (2025)
The Virtues of Pessimism in Inverse Reinforcement Learning
von: Wu, David, et al.
Veröffentlicht: (2024)
von: Wu, David, et al.
Veröffentlicht: (2024)
Sample-Efficient Distributionally Robust Multi-Agent Reinforcement Learning via Online Interaction
von: Farhat, Zain Ulabedeen, et al.
Veröffentlicht: (2025)
von: Farhat, Zain Ulabedeen, et al.
Veröffentlicht: (2025)
Bayesian Inverse Reinforcement Learning for Non-Markovian Rewards
von: Topper, Noah, et al.
Veröffentlicht: (2024)
von: Topper, Noah, et al.
Veröffentlicht: (2024)
DROP: Distributional and Regular Optimism and Pessimism for Reinforcement Learning
von: Kobayashi, Taisuke
Veröffentlicht: (2024)
von: Kobayashi, Taisuke
Veröffentlicht: (2024)
Pessimism Meets Risk: Risk-Sensitive Offline Reinforcement Learning
von: Zhang, Dake, et al.
Veröffentlicht: (2024)
von: Zhang, Dake, et al.
Veröffentlicht: (2024)
Automaton Distillation: Neuro-Symbolic Transfer Learning for Deep Reinforcement Learning
von: Singireddy, Suraj, et al.
Veröffentlicht: (2023)
von: Singireddy, Suraj, et al.
Veröffentlicht: (2023)
Towards Robust Zero-Shot Reinforcement Learning
von: Zheng, Kexin, et al.
Veröffentlicht: (2025)
von: Zheng, Kexin, et al.
Veröffentlicht: (2025)
A Unified Framework for Zero-Shot Reinforcement Learning
von: Di Ventura, Jacopo, et al.
Veröffentlicht: (2025)
von: Di Ventura, Jacopo, et al.
Veröffentlicht: (2025)
Constrained Reinforcement Learning Under Model Mismatch
von: Sun, Zhongchang, et al.
Veröffentlicht: (2024)
von: Sun, Zhongchang, et al.
Veröffentlicht: (2024)
Zero-Shot Policy Transfer in Reinforcement Learning using Buckingham's Pi Theorem
von: Pascoa, Francisco, et al.
Veröffentlicht: (2025)
von: Pascoa, Francisco, et al.
Veröffentlicht: (2025)
On Zero-Shot Reinforcement Learning
von: Jeen, Scott
Veröffentlicht: (2025)
von: Jeen, Scott
Veröffentlicht: (2025)
Momentum for the Win: Collaborative Federated Reinforcement Learning across Heterogeneous Environments
von: Wang, Han, et al.
Veröffentlicht: (2024)
von: Wang, Han, et al.
Veröffentlicht: (2024)
Beyond Pessimism: Offline Learning in KL-regularized Games
von: Zhang, Yuheng, et al.
Veröffentlicht: (2026)
von: Zhang, Yuheng, et al.
Veröffentlicht: (2026)
Align-Pro: A Principled Approach to Prompt Optimization for LLM Alignment
von: Trivedi, Prashant, et al.
Veröffentlicht: (2025)
von: Trivedi, Prashant, et al.
Veröffentlicht: (2025)
Improved Regret Bound for Safe Reinforcement Learning via Tighter Cost Pessimism and Reward Optimism
von: Yu, Kihyun, et al.
Veröffentlicht: (2024)
von: Yu, Kihyun, et al.
Veröffentlicht: (2024)
DRED: Zero-Shot Transfer in Reinforcement Learning via Data-Regularised Environment Design
von: Garcin, Samuel, et al.
Veröffentlicht: (2024)
von: Garcin, Samuel, et al.
Veröffentlicht: (2024)
Zero-Shot Reinforcement Learning via Function Encoders
von: Ingebrand, Tyler, et al.
Veröffentlicht: (2024)
von: Ingebrand, Tyler, et al.
Veröffentlicht: (2024)
Efficient Reinforcement Learning for Zero-Shot Coordination in Evolving Games
von: Hui, Bingyu, et al.
Veröffentlicht: (2025)
von: Hui, Bingyu, et al.
Veröffentlicht: (2025)
Provable Zero-Shot Generalization in Offline Reinforcement Learning
von: Wang, Zhiyong, et al.
Veröffentlicht: (2025)
von: Wang, Zhiyong, et al.
Veröffentlicht: (2025)
Pessimism in the Face of Confounders: Provably Efficient Offline Reinforcement Learning in Partially Observable Markov Decision Processes
von: Lu, Miao, et al.
Veröffentlicht: (2022)
von: Lu, Miao, et al.
Veröffentlicht: (2022)
Tackling the Zero-Shot Reinforcement Learning Loss Directly
von: Ollivier, Yann
Veröffentlicht: (2025)
von: Ollivier, Yann
Veröffentlicht: (2025)
Towards Stable and Effective Reinforcement Learning for Mixture-of-Experts
von: Zhang, Di, et al.
Veröffentlicht: (2025)
von: Zhang, Di, et al.
Veröffentlicht: (2025)
Humanoid-Gym: Reinforcement Learning for Humanoid Robot with Zero-Shot Sim2Real Transfer
von: Gu, Xinyang, et al.
Veröffentlicht: (2024)
von: Gu, Xinyang, et al.
Veröffentlicht: (2024)
Quantile Geometry Regularization for Distributional Reinforcement Learning
von: Zhang, Zhaofan, et al.
Veröffentlicht: (2026)
von: Zhang, Zhaofan, et al.
Veröffentlicht: (2026)
Equilibrium Policy Generalization: A Reinforcement Learning Framework for Cross-Graph Zero-Shot Generalization in Pursuit-Evasion Games
von: Lu, Runyu, et al.
Veröffentlicht: (2025)
von: Lu, Runyu, et al.
Veröffentlicht: (2025)
A Tale of Two Cities: Pessimism and Opportunism in Offline Dynamic Pricing
von: Bian, Zeyu, et al.
Veröffentlicht: (2024)
von: Bian, Zeyu, et al.
Veröffentlicht: (2024)
Mitigating Preference Hacking in Policy Optimization with Pessimism
von: Gupta, Dhawal, et al.
Veröffentlicht: (2025)
von: Gupta, Dhawal, et al.
Veröffentlicht: (2025)
Pessimism-Free Offline Learning in General-Sum Games via KL Regularization
von: Chen, Claire, et al.
Veröffentlicht: (2026)
von: Chen, Claire, et al.
Veröffentlicht: (2026)
Zero-Shot Reinforcement Learning Under Partial Observability
von: Jeen, Scott, et al.
Veröffentlicht: (2025)
von: Jeen, Scott, et al.
Veröffentlicht: (2025)
Decoupled Guidance Diffusion for Adaptive Offline Safe Reinforcement Learning
von: Chen, Rufeng, et al.
Veröffentlicht: (2026)
von: Chen, Rufeng, et al.
Veröffentlicht: (2026)
TD-JEPA: Latent-predictive Representations for Zero-Shot Reinforcement Learning
von: Bagatella, Marco, et al.
Veröffentlicht: (2025)
von: Bagatella, Marco, et al.
Veröffentlicht: (2025)
From Few-Shot to Zero-Shot: Towards Generalist Graph Anomaly Detection
von: Liu, Yixin, et al.
Veröffentlicht: (2026)
von: Liu, Yixin, et al.
Veröffentlicht: (2026)
Towards Zero-Shot Task-Generalizable Learning on fMRI
von: Wang, Jiyao, et al.
Veröffentlicht: (2025)
von: Wang, Jiyao, et al.
Veröffentlicht: (2025)
Zero-Shot Reinforcement Learning from Low Quality Data
von: Jeen, Scott, et al.
Veröffentlicht: (2023)
von: Jeen, Scott, et al.
Veröffentlicht: (2023)
Ähnliche Einträge
-
CADENT: Gated Hybrid Distillation for Sample-Efficient Transfer in Reinforcement Learning
von: Alinejad, Mahyar, et al.
Veröffentlicht: (2026) -
Provably Sample-Efficient Robust Reinforcement Learning with Average Reward
von: Roch, Zachary, et al.
Veröffentlicht: (2025) -
Online Robust Reinforcement Learning with General Function Approximation
von: Ghosh, Debamita, et al.
Veröffentlicht: (2025) -
ORVIT: Near-Optimal Online Distributionally Robust Reinforcement Learning
von: Ghosh, Debamita, et al.
Veröffentlicht: (2025) -
Robust Transfer Learning with Side Information
von: Awad, Akram S., et al.
Veröffentlicht: (2026)