Salvato in:
| Autori principali: | Hao, Yuhang, Wang, Zengfu, Fu, Jing, Pan, Quan |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2024
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2402.12015 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
Deep Q-Learning with Gradient Target Tracking
di: Park, Bum Geun, et al.
Pubblicazione: (2025)
di: Park, Bum Geun, et al.
Pubblicazione: (2025)
A Closed-loop, State-centric, Multi-agent Framework for Passenger Load Estimation from Heterogeneous Data Streams
di: Xu, Yiyao, et al.
Pubblicazione: (2026)
di: Xu, Yiyao, et al.
Pubblicazione: (2026)
Finite-Time Analysis of On-Policy Heterogeneous Federated Reinforcement Learning
di: Zhang, Chenyu, et al.
Pubblicazione: (2024)
di: Zhang, Chenyu, et al.
Pubblicazione: (2024)
Predictive Linear Online Tracking for Unknown Targets
di: Tsiamis, Anastasios, et al.
Pubblicazione: (2024)
di: Tsiamis, Anastasios, et al.
Pubblicazione: (2024)
Convergence and stability of Q-learning in Hierarchical Reinforcement Learning
di: Manenti, Massimiliano, et al.
Pubblicazione: (2025)
di: Manenti, Massimiliano, et al.
Pubblicazione: (2025)
From Target Tracking to Targeting Track -- Part III: Stochastic Process Modeling and Online Learning
di: Li, Tiancheng, et al.
Pubblicazione: (2025)
di: Li, Tiancheng, et al.
Pubblicazione: (2025)
Tensor-Efficient High-Dimensional Q-learning
di: Wu, Junyi, et al.
Pubblicazione: (2025)
di: Wu, Junyi, et al.
Pubblicazione: (2025)
Variance-Reduced Cascade Q-learning: Algorithms and Sample Complexity
di: Boveiri, Mohammad, et al.
Pubblicazione: (2024)
di: Boveiri, Mohammad, et al.
Pubblicazione: (2024)
Clustered Federated Learning for Generalizable FDIA Detection in Smart Grids with Heterogeneous Data
di: Li, Yunfeng, et al.
Pubblicazione: (2025)
di: Li, Yunfeng, et al.
Pubblicazione: (2025)
Finite-Time Analysis of Simultaneous Double Q-learning
di: Na, Hyunjun, et al.
Pubblicazione: (2024)
di: Na, Hyunjun, et al.
Pubblicazione: (2024)
A Q-learning Approach for Adherence-Aware Recommendations
di: Faros, Ioannis, et al.
Pubblicazione: (2023)
di: Faros, Ioannis, et al.
Pubblicazione: (2023)
A Deep Q-Learning based Smart Scheduling of EVs for Demand Response in Smart Grids
di: Chifu, Viorica Rozina, et al.
Pubblicazione: (2024)
di: Chifu, Viorica Rozina, et al.
Pubblicazione: (2024)
Entropy-regularized Diffusion Policy with Q-Ensembles for Offline Reinforcement Learning
di: Zhang, Ruoqi, et al.
Pubblicazione: (2024)
di: Zhang, Ruoqi, et al.
Pubblicazione: (2024)
Smoothed Online Optimization for Target Tracking: Robust and Learning-Augmented Algorithms
di: Zeynali, Ali, et al.
Pubblicazione: (2025)
di: Zeynali, Ali, et al.
Pubblicazione: (2025)
From Target Tracking to Targeting Track -- Part I: A Metric for Spatio-Temporal Trajectory Evaluation
di: Li, Tiancheng, et al.
Pubblicazione: (2025)
di: Li, Tiancheng, et al.
Pubblicazione: (2025)
Coordinating Planning and Tracking in Layered Control Policies via Actor-Critic Learning
di: Yang, Fengjun, et al.
Pubblicazione: (2024)
di: Yang, Fengjun, et al.
Pubblicazione: (2024)
Multi-Target Radar Search and Track Using Sequence-Capable Deep Reinforcement Learning
di: Ewers, Jan-Hendrik, et al.
Pubblicazione: (2025)
di: Ewers, Jan-Hendrik, et al.
Pubblicazione: (2025)
Stone Soup Multi-Target Tracking Feature Extraction For Autonomous Search And Track In Deep Reinforcement Learning Environment
di: Ewers, Jan-Hendrik, et al.
Pubblicazione: (2025)
di: Ewers, Jan-Hendrik, et al.
Pubblicazione: (2025)
Smart energy management: process structure-based hybrid neural networks for optimal scheduling and economic predictive control in integrated systems
di: Wu, Long, et al.
Pubblicazione: (2024)
di: Wu, Long, et al.
Pubblicazione: (2024)
Model-Agnostic Zeroth-Order Policy Optimization for Meta-Learning of Ergodic Linear Quadratic Regulators
di: Pan, Yunian, et al.
Pubblicazione: (2024)
di: Pan, Yunian, et al.
Pubblicazione: (2024)
SmartMeterFM: Unifying Smart Meter Data Generative Tasks Using Flow Matching Models
di: Lin, Nan, et al.
Pubblicazione: (2026)
di: Lin, Nan, et al.
Pubblicazione: (2026)
GNN-Enabled Robust Hybrid Beamforming with Score-Based CSI Generation and Denoising
di: Li, Yuhang, et al.
Pubblicazione: (2025)
di: Li, Yuhang, et al.
Pubblicazione: (2025)
Adaptive Policy Learning to Additional Tasks
di: Hao, Wenjian, et al.
Pubblicazione: (2023)
di: Hao, Wenjian, et al.
Pubblicazione: (2023)
Guaranteed Trajectory Tracking under Learned Dynamics with Contraction Metrics and Disturbance Estimation
di: Zhao, Pan, et al.
Pubblicazione: (2021)
di: Zhao, Pan, et al.
Pubblicazione: (2021)
Virtual Smart Metering in District Heating Networks via Heterogeneous Spatial-Temporal Graph Neural Networks
di: Niresi, Keivan Faghih, et al.
Pubblicazione: (2026)
di: Niresi, Keivan Faghih, et al.
Pubblicazione: (2026)
Robust Q-Learning under Corrupted Rewards
di: Maity, Sreejeet, et al.
Pubblicazione: (2024)
di: Maity, Sreejeet, et al.
Pubblicazione: (2024)
Learning of Linear Dynamical Systems as a Non-Commutative Polynomial Optimization Problem
di: Zhou, Quan, et al.
Pubblicazione: (2020)
di: Zhou, Quan, et al.
Pubblicazione: (2020)
Structured Deep Neural Network-Based Backstepping Trajectory Tracking Control for Lagrangian Systems
di: Qian, Jiajun, et al.
Pubblicazione: (2024)
di: Qian, Jiajun, et al.
Pubblicazione: (2024)
A Variance-Reduced Stochastic Gradient Tracking Algorithm for Decentralized Optimization with Orthogonality Constraints
di: Wang, Lei, et al.
Pubblicazione: (2022)
di: Wang, Lei, et al.
Pubblicazione: (2022)
Transferable Deployment of Semantic Edge Inference Systems via Unsupervised Domain Adaption
di: Jiao, Weiqiang, et al.
Pubblicazione: (2025)
di: Jiao, Weiqiang, et al.
Pubblicazione: (2025)
Corruption-Tolerant Asynchronous Q-Learning with Near-Optimal Rates
di: Maity, Sreejeet, et al.
Pubblicazione: (2025)
di: Maity, Sreejeet, et al.
Pubblicazione: (2025)
InterQ: A DQN Framework for Optimal Intermittent Control
di: Aggarwal, Shubham, et al.
Pubblicazione: (2025)
di: Aggarwal, Shubham, et al.
Pubblicazione: (2025)
Faster Q-Learning Algorithms for Restless Bandits
di: Kakarapalli, Parvish, et al.
Pubblicazione: (2024)
di: Kakarapalli, Parvish, et al.
Pubblicazione: (2024)
Wasserstein Distributionally Robust Nash Equilibrium Seeking with Heterogeneous Data: A Lagrangian Approach
di: Wang, Zifan, et al.
Pubblicazione: (2025)
di: Wang, Zifan, et al.
Pubblicazione: (2025)
Optimal Batch-Size Control for Low-Latency Federated Learning with Device Heterogeneity
di: Yang, Huiling, et al.
Pubblicazione: (2025)
di: Yang, Huiling, et al.
Pubblicazione: (2025)
Hierarchical Policy-Gradient Reinforcement Learning for Multi-Agent Shepherding Control of Non-Cohesive Targets
di: Covone, Stefano, et al.
Pubblicazione: (2025)
di: Covone, Stefano, et al.
Pubblicazione: (2025)
Optimal Transport-Assisted Risk-Sensitive Q-Learning
di: Shahrooei, Zahra, et al.
Pubblicazione: (2024)
di: Shahrooei, Zahra, et al.
Pubblicazione: (2024)
Generalized Multi-hop Traffic Pressure for Heterogeneous Traffic Perimeter Control
di: Li, Xiaocan, et al.
Pubblicazione: (2024)
di: Li, Xiaocan, et al.
Pubblicazione: (2024)
Model-Free Output Feedback Stabilization via Policy Gradient Methods
di: Zhang, Ankang, et al.
Pubblicazione: (2026)
di: Zhang, Ankang, et al.
Pubblicazione: (2026)
Driving behavior-guided battery health monitoring for electric vehicles using machine learning
di: Jiang, Nanhua, et al.
Pubblicazione: (2023)
di: Jiang, Nanhua, et al.
Pubblicazione: (2023)
Documenti analoghi
-
Deep Q-Learning with Gradient Target Tracking
di: Park, Bum Geun, et al.
Pubblicazione: (2025) -
A Closed-loop, State-centric, Multi-agent Framework for Passenger Load Estimation from Heterogeneous Data Streams
di: Xu, Yiyao, et al.
Pubblicazione: (2026) -
Finite-Time Analysis of On-Policy Heterogeneous Federated Reinforcement Learning
di: Zhang, Chenyu, et al.
Pubblicazione: (2024) -
Predictive Linear Online Tracking for Unknown Targets
di: Tsiamis, Anastasios, et al.
Pubblicazione: (2024) -
Convergence and stability of Q-learning in Hierarchical Reinforcement Learning
di: Manenti, Massimiliano, et al.
Pubblicazione: (2025)