:: Library Catalog

Buchumschlag

Gespeichert in:

Bibliographische Detailangaben
1. Verfasser:	He, Shenghong
Format:	Preprint
Veröffentlicht:	2026
Schlagworte:	Machine Learning
Online-Zugang:	https://arxiv.org/abs/2602.19582
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Ähnliche Einträge

Gradient Inversion in Federated Reinforcement Learning
von: He, Shenghong
Veröffentlicht: (2025)

Model-Based Offline Reinforcement Learning with Reliability-Guaranteed Sequence Modeling
von: He, Shenghong
Veröffentlicht: (2025)

Adaptive Coarse-to-Fine Subgoal Refinement for Long-Horizon Offline Goal-Conditioned Reinforcement Learning
von: Ke, Kaiqiang, et al.
Veröffentlicht: (2026)

Competitive Advantage Attacks to Decentralized Federated Learning
von: Jia, Yuqi, et al.
Veröffentlicht: (2023)

An Advantage-based Optimization Method for Reinforcement Learning in Large Action Space
von: Lin, Hai, et al.
Veröffentlicht: (2024)

Active Advantage-Aligned Online Reinforcement Learning with Offline Data
von: Liu, Xuefeng, et al.
Veröffentlicht: (2025)

Advantage-Guided Diffusion for Model-Based Reinforcement Learning
von: Foffano, Daniele, et al.
Veröffentlicht: (2026)

Quantum Advantage in Multi Agent Reinforcement Learning
von: Dahia, Simranjeet Singh, et al.
Veröffentlicht: (2026)

Quantum Advantage Actor-Critic for Reinforcement Learning
von: Kölle, Michael, et al.
Veröffentlicht: (2024)

Taming OOD Actions for Offline Reinforcement Learning: An Advantage-Based Approach
von: Chen, Xuyang, et al.
Veröffentlicht: (2025)

Memory-Based Advantage Shaping for LLM-Guided Reinforcement Learning
von: Nourzad, Narjes, et al.
Veröffentlicht: (2026)

Action Gaps and Advantages in Continuous-Time Distributional Reinforcement Learning
von: Wiltzer, Harley, et al.
Veröffentlicht: (2024)

Adaptive Advantage-Guided Policy Regularization for Offline Reinforcement Learning
von: Liu, Tenglong, et al.
Veröffentlicht: (2024)

ADORA: Training Reasoning Models with Dynamic Advantage Estimation on Reinforcement Learning
von: Ren, Qingnan, et al.
Veröffentlicht: (2026)

FAWAC: Feasibility Informed Advantage Weighted Regression for Persistent Safety in Offline Reinforcement Learning
von: Koirala, Prajwal, et al.
Veröffentlicht: (2024)

DVAO: Dynamic Variance-adaptive Advantage Optimization for Multi-reward Reinforcement Learning
von: Jiang, Guochao, et al.
Veröffentlicht: (2026)

SOAP-RL: Sequential Option Advantage Propagation for Reinforcement Learning in POMDP Environments
von: Ishida, Shu, et al.
Veröffentlicht: (2024)

POLAR: Policy-based Layerwise Reinforcement Learning Method for Stealthy Backdoor Attacks in Federated Learning
von: Yu, Kuai, et al.
Veröffentlicht: (2025)

Reward-Preserving Attacks For Robust Reinforcement Learning
von: Schott, Lucas, et al.
Veröffentlicht: (2026)

Temporal Analysis of Adversarial Attacks in Federated Learning
von: Mapakshi, Rohit, et al.
Veröffentlicht: (2025)

MAGIC: Multi-Step Advantage-Gated Causal Influence for Multi-agent Reinforcement Learning
von: Yu, Haohan, et al.
Veröffentlicht: (2026)

LAD: Learning Advantage Distribution for Reasoning
von: Li, Wendi, et al.
Veröffentlicht: (2026)

Path Learning with Trajectory Advantage Regression
von: Miyaguchi, Kohei
Veröffentlicht: (2025)

Structure learning with Temporal Gaussian Mixture for model-based Reinforcement Learning
von: Champion, Théophile, et al.
Veröffentlicht: (2024)

Temporal Abstraction in Reinforcement Learning with Offline Data
von: Ayyagari, Ranga Shaarad, et al.
Veröffentlicht: (2024)

Reinforcement Learning From State and Temporal Differences
von: Weaver, Lex, et al.
Veröffentlicht: (2025)

Reinforcement Learning for Diffusion LLMs with Entropy-Guided Step Selection and Stepwise Advantages
von: Kunde, Vishnu Teja, et al.
Veröffentlicht: (2026)

A2PO: Towards Effective Offline Reinforcement Learning from an Advantage-aware Perspective
von: Qing, Yunpeng, et al.
Veröffentlicht: (2024)

Robust Categorical Data Clustering Guided by Multi-Granular Competitive Learning
von: Cai, Shenghong, et al.
Veröffentlicht: (2026)

CS-GBA: A Critical Sample-based Gradient-guided Backdoor Attack for Offline Reinforcement Learning
von: Zhao, Yuanjie, et al.
Veröffentlicht: (2026)

ARMOR: Robust Reinforcement Learning-based Control for UAVs under Physical Attacks
von: Dash, Pritam, et al.
Veröffentlicht: (2025)

TEACH: Temporal Variance-Driven Curriculum for Reinforcement Learning
von: Chaudhary, Gaurav, et al.
Veröffentlicht: (2025)

Free Energy-Driven Reinforcement Learning with Adaptive Advantage Shaping for Unsupervised Reasoning in LLMs
von: Huang, Yiming, et al.
Veröffentlicht: (2026)

Quantum Reinforcement Learning in Non-Abelian Environments: Unveiling Novel Formulations and Quantum Advantage Exploration
von: Ghosal, Shubhayan
Veröffentlicht: (2024)

Transformers Can Learn Temporal Difference Methods for In-Context Reinforcement Learning
von: Wang, Jiuqi, et al.
Veröffentlicht: (2024)

Temporal Distance-aware Transition Augmentation for Offline Model-based Reinforcement Learning
von: Lee, Dongsu, et al.
Veröffentlicht: (2025)

Discovering Temporally-Aware Reinforcement Learning Algorithms
von: Jackson, Matthew Thomas, et al.
Veröffentlicht: (2024)

Open the Black Box: Step-based Policy Updates for Temporally-Correlated Episodic Reinforcement Learning
von: Li, Ge, et al.
Veröffentlicht: (2024)

PNAct: Crafting Backdoor Attacks in Safe Reinforcement Learning
von: Guo, Weiran, et al.
Veröffentlicht: (2025)

Local Environment Poisoning Attacks on Federated Reinforcement Learning
von: Ma, Evelyn, et al.
Veröffentlicht: (2023)