Gespeichert in:
| 1. Verfasser: | He, Shenghong |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2026
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2602.19582 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
Gradient Inversion in Federated Reinforcement Learning
von: He, Shenghong
Veröffentlicht: (2025)
von: He, Shenghong
Veröffentlicht: (2025)
Model-Based Offline Reinforcement Learning with Reliability-Guaranteed Sequence Modeling
von: He, Shenghong
Veröffentlicht: (2025)
von: He, Shenghong
Veröffentlicht: (2025)
Adaptive Coarse-to-Fine Subgoal Refinement for Long-Horizon Offline Goal-Conditioned Reinforcement Learning
von: Ke, Kaiqiang, et al.
Veröffentlicht: (2026)
von: Ke, Kaiqiang, et al.
Veröffentlicht: (2026)
Competitive Advantage Attacks to Decentralized Federated Learning
von: Jia, Yuqi, et al.
Veröffentlicht: (2023)
von: Jia, Yuqi, et al.
Veröffentlicht: (2023)
An Advantage-based Optimization Method for Reinforcement Learning in Large Action Space
von: Lin, Hai, et al.
Veröffentlicht: (2024)
von: Lin, Hai, et al.
Veröffentlicht: (2024)
Active Advantage-Aligned Online Reinforcement Learning with Offline Data
von: Liu, Xuefeng, et al.
Veröffentlicht: (2025)
von: Liu, Xuefeng, et al.
Veröffentlicht: (2025)
Advantage-Guided Diffusion for Model-Based Reinforcement Learning
von: Foffano, Daniele, et al.
Veröffentlicht: (2026)
von: Foffano, Daniele, et al.
Veröffentlicht: (2026)
Quantum Advantage in Multi Agent Reinforcement Learning
von: Dahia, Simranjeet Singh, et al.
Veröffentlicht: (2026)
von: Dahia, Simranjeet Singh, et al.
Veröffentlicht: (2026)
Quantum Advantage Actor-Critic for Reinforcement Learning
von: Kölle, Michael, et al.
Veröffentlicht: (2024)
von: Kölle, Michael, et al.
Veröffentlicht: (2024)
Taming OOD Actions for Offline Reinforcement Learning: An Advantage-Based Approach
von: Chen, Xuyang, et al.
Veröffentlicht: (2025)
von: Chen, Xuyang, et al.
Veröffentlicht: (2025)
Memory-Based Advantage Shaping for LLM-Guided Reinforcement Learning
von: Nourzad, Narjes, et al.
Veröffentlicht: (2026)
von: Nourzad, Narjes, et al.
Veröffentlicht: (2026)
Action Gaps and Advantages in Continuous-Time Distributional Reinforcement Learning
von: Wiltzer, Harley, et al.
Veröffentlicht: (2024)
von: Wiltzer, Harley, et al.
Veröffentlicht: (2024)
Adaptive Advantage-Guided Policy Regularization for Offline Reinforcement Learning
von: Liu, Tenglong, et al.
Veröffentlicht: (2024)
von: Liu, Tenglong, et al.
Veröffentlicht: (2024)
ADORA: Training Reasoning Models with Dynamic Advantage Estimation on Reinforcement Learning
von: Ren, Qingnan, et al.
Veröffentlicht: (2026)
von: Ren, Qingnan, et al.
Veröffentlicht: (2026)
FAWAC: Feasibility Informed Advantage Weighted Regression for Persistent Safety in Offline Reinforcement Learning
von: Koirala, Prajwal, et al.
Veröffentlicht: (2024)
von: Koirala, Prajwal, et al.
Veröffentlicht: (2024)
DVAO: Dynamic Variance-adaptive Advantage Optimization for Multi-reward Reinforcement Learning
von: Jiang, Guochao, et al.
Veröffentlicht: (2026)
von: Jiang, Guochao, et al.
Veröffentlicht: (2026)
SOAP-RL: Sequential Option Advantage Propagation for Reinforcement Learning in POMDP Environments
von: Ishida, Shu, et al.
Veröffentlicht: (2024)
von: Ishida, Shu, et al.
Veröffentlicht: (2024)
POLAR: Policy-based Layerwise Reinforcement Learning Method for Stealthy Backdoor Attacks in Federated Learning
von: Yu, Kuai, et al.
Veröffentlicht: (2025)
von: Yu, Kuai, et al.
Veröffentlicht: (2025)
Reward-Preserving Attacks For Robust Reinforcement Learning
von: Schott, Lucas, et al.
Veröffentlicht: (2026)
von: Schott, Lucas, et al.
Veröffentlicht: (2026)
Temporal Analysis of Adversarial Attacks in Federated Learning
von: Mapakshi, Rohit, et al.
Veröffentlicht: (2025)
von: Mapakshi, Rohit, et al.
Veröffentlicht: (2025)
MAGIC: Multi-Step Advantage-Gated Causal Influence for Multi-agent Reinforcement Learning
von: Yu, Haohan, et al.
Veröffentlicht: (2026)
von: Yu, Haohan, et al.
Veröffentlicht: (2026)
LAD: Learning Advantage Distribution for Reasoning
von: Li, Wendi, et al.
Veröffentlicht: (2026)
von: Li, Wendi, et al.
Veröffentlicht: (2026)
Path Learning with Trajectory Advantage Regression
von: Miyaguchi, Kohei
Veröffentlicht: (2025)
von: Miyaguchi, Kohei
Veröffentlicht: (2025)
Structure learning with Temporal Gaussian Mixture for model-based Reinforcement Learning
von: Champion, Théophile, et al.
Veröffentlicht: (2024)
von: Champion, Théophile, et al.
Veröffentlicht: (2024)
Temporal Abstraction in Reinforcement Learning with Offline Data
von: Ayyagari, Ranga Shaarad, et al.
Veröffentlicht: (2024)
von: Ayyagari, Ranga Shaarad, et al.
Veröffentlicht: (2024)
Reinforcement Learning From State and Temporal Differences
von: Weaver, Lex, et al.
Veröffentlicht: (2025)
von: Weaver, Lex, et al.
Veröffentlicht: (2025)
Reinforcement Learning for Diffusion LLMs with Entropy-Guided Step Selection and Stepwise Advantages
von: Kunde, Vishnu Teja, et al.
Veröffentlicht: (2026)
von: Kunde, Vishnu Teja, et al.
Veröffentlicht: (2026)
A2PO: Towards Effective Offline Reinforcement Learning from an Advantage-aware Perspective
von: Qing, Yunpeng, et al.
Veröffentlicht: (2024)
von: Qing, Yunpeng, et al.
Veröffentlicht: (2024)
Robust Categorical Data Clustering Guided by Multi-Granular Competitive Learning
von: Cai, Shenghong, et al.
Veröffentlicht: (2026)
von: Cai, Shenghong, et al.
Veröffentlicht: (2026)
CS-GBA: A Critical Sample-based Gradient-guided Backdoor Attack for Offline Reinforcement Learning
von: Zhao, Yuanjie, et al.
Veröffentlicht: (2026)
von: Zhao, Yuanjie, et al.
Veröffentlicht: (2026)
ARMOR: Robust Reinforcement Learning-based Control for UAVs under Physical Attacks
von: Dash, Pritam, et al.
Veröffentlicht: (2025)
von: Dash, Pritam, et al.
Veröffentlicht: (2025)
TEACH: Temporal Variance-Driven Curriculum for Reinforcement Learning
von: Chaudhary, Gaurav, et al.
Veröffentlicht: (2025)
von: Chaudhary, Gaurav, et al.
Veröffentlicht: (2025)
Free Energy-Driven Reinforcement Learning with Adaptive Advantage Shaping for Unsupervised Reasoning in LLMs
von: Huang, Yiming, et al.
Veröffentlicht: (2026)
von: Huang, Yiming, et al.
Veröffentlicht: (2026)
Quantum Reinforcement Learning in Non-Abelian Environments: Unveiling Novel Formulations and Quantum Advantage Exploration
von: Ghosal, Shubhayan
Veröffentlicht: (2024)
von: Ghosal, Shubhayan
Veröffentlicht: (2024)
Transformers Can Learn Temporal Difference Methods for In-Context Reinforcement Learning
von: Wang, Jiuqi, et al.
Veröffentlicht: (2024)
von: Wang, Jiuqi, et al.
Veröffentlicht: (2024)
Temporal Distance-aware Transition Augmentation for Offline Model-based Reinforcement Learning
von: Lee, Dongsu, et al.
Veröffentlicht: (2025)
von: Lee, Dongsu, et al.
Veröffentlicht: (2025)
Discovering Temporally-Aware Reinforcement Learning Algorithms
von: Jackson, Matthew Thomas, et al.
Veröffentlicht: (2024)
von: Jackson, Matthew Thomas, et al.
Veröffentlicht: (2024)
Open the Black Box: Step-based Policy Updates for Temporally-Correlated Episodic Reinforcement Learning
von: Li, Ge, et al.
Veröffentlicht: (2024)
von: Li, Ge, et al.
Veröffentlicht: (2024)
PNAct: Crafting Backdoor Attacks in Safe Reinforcement Learning
von: Guo, Weiran, et al.
Veröffentlicht: (2025)
von: Guo, Weiran, et al.
Veröffentlicht: (2025)
Local Environment Poisoning Attacks on Federated Reinforcement Learning
von: Ma, Evelyn, et al.
Veröffentlicht: (2023)
von: Ma, Evelyn, et al.
Veröffentlicht: (2023)
Ähnliche Einträge
-
Gradient Inversion in Federated Reinforcement Learning
von: He, Shenghong
Veröffentlicht: (2025) -
Model-Based Offline Reinforcement Learning with Reliability-Guaranteed Sequence Modeling
von: He, Shenghong
Veröffentlicht: (2025) -
Adaptive Coarse-to-Fine Subgoal Refinement for Long-Horizon Offline Goal-Conditioned Reinforcement Learning
von: Ke, Kaiqiang, et al.
Veröffentlicht: (2026) -
Competitive Advantage Attacks to Decentralized Federated Learning
von: Jia, Yuqi, et al.
Veröffentlicht: (2023) -
An Advantage-based Optimization Method for Reinforcement Learning in Large Action Space
von: Lin, Hai, et al.
Veröffentlicht: (2024)