Enregistré dans:
| Auteurs principaux: | Chen, Jiayu, Ganguly, Bhargav, Xu, Yang, Mei, Yongsheng, Lan, Tian, Aggarwal, Vaneet |
|---|---|
| Format: | Preprint |
| Publié: |
2024
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2402.13777 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
Variational Offline Multi-agent Skill Discovery
par: Chen, Jiayu, et autres
Publié: (2024)
par: Chen, Jiayu, et autres
Publié: (2024)
Quantum Speedups in Regret Analysis of Infinite Horizon Average-Reward Markov Decision Processes
par: Ganguly, Bhargav, et autres
Publié: (2023)
par: Ganguly, Bhargav, et autres
Publié: (2023)
Accelerating Quantum Reinforcement Learning with a Quantum Natural Policy Gradient Based Approach
par: Xu, Yang, et autres
Publié: (2025)
par: Xu, Yang, et autres
Publié: (2025)
A Technical Survey of Reinforcement Learning Techniques for Large Language Models
par: Srivastava, Saksham Sahai, et autres
Publié: (2025)
par: Srivastava, Saksham Sahai, et autres
Publié: (2025)
Global Convergence Guarantees for Federated Policy Gradient Methods with Adversaries
par: Ganesh, Swetha, et autres
Publié: (2024)
par: Ganesh, Swetha, et autres
Publié: (2024)
Network Diffuser for Placing-Scheduling Service Function Chains with Inverse Demonstration
par: Zhang, Zuyuan, et autres
Publié: (2025)
par: Zhang, Zuyuan, et autres
Publié: (2025)
Last-Iterate Convergence of General Parameterized Policies in Constrained MDPs
par: Mondal, Washim Uddin, et autres
Publié: (2024)
par: Mondal, Washim Uddin, et autres
Publié: (2024)
Learning General Parameterized Policies for Infinite Horizon Average Reward Constrained MDPs via Primal-Dual Policy Gradient Algorithm
par: Bai, Qinbo, et autres
Publié: (2024)
par: Bai, Qinbo, et autres
Publié: (2024)
Efficient $Q$-Learning and Actor-Critic Methods for Robust Average Reward Reinforcement Learning
par: Xu, Yang, et autres
Publié: (2025)
par: Xu, Yang, et autres
Publié: (2025)
Improved Sample Complexity Analysis of Natural Policy Gradient Algorithm with General Parameterization for Infinite Horizon Discounted Reward Markov Decision Processes
par: Mondal, Washim Uddin, et autres
Publié: (2023)
par: Mondal, Washim Uddin, et autres
Publié: (2023)
Discrete State Diffusion Models: A Sample Complexity Perspective
par: Srikanth, Aadithya, et autres
Publié: (2025)
par: Srikanth, Aadithya, et autres
Publié: (2025)
Sample-Efficient Constrained Reinforcement Learning with General Parameterization
par: Mondal, Washim Uddin, et autres
Publié: (2024)
par: Mondal, Washim Uddin, et autres
Publié: (2024)
Joint Optimization of Multi-Objective Reinforcement Learning with Policy Gradient Based Algorithm
par: Bai, Qinbo, et autres
Publié: (2021)
par: Bai, Qinbo, et autres
Publié: (2021)
Sample Complexity Analysis for Constrained Bilevel Reinforcement Learning
par: Saxena, Naman, et autres
Publié: (2026)
par: Saxena, Naman, et autres
Publié: (2026)
Rack Position Optimization in Large-Scale Heterogeneous Data Centers
par: Chen, Chang-Lin, et autres
Publié: (2025)
par: Chen, Chang-Lin, et autres
Publié: (2025)
Policy-Driven World Model Adaptation for Robust Offline Model-based Reinforcement Learning
par: Chen, Jiayu, et autres
Publié: (2025)
par: Chen, Jiayu, et autres
Publié: (2025)
Don't Freeze, Don't Crash: Extending the Safe Operating Range of Neural Navigation in Dense Crowds
par: Zhang, Jiefu, et autres
Publié: (2026)
par: Zhang, Jiefu, et autres
Publié: (2026)
Achieving Zero Constraint Violation for Constrained Reinforcement Learning via Conservative Natural Policy Gradient Primal-Dual Algorithm
par: Bai, Qinbo, et autres
Publié: (2022)
par: Bai, Qinbo, et autres
Publié: (2022)
Constrained Reinforcement Learning with Average Reward Objective: Model-Based and Model-Free Algorithms
par: Aggarwal, Vaneet, et autres
Publié: (2024)
par: Aggarwal, Vaneet, et autres
Publié: (2024)
Regret Analysis of Policy Gradient Algorithm for Infinite Horizon Average Reward Markov Decision Processes
par: Bai, Qinbo, et autres
Publié: (2023)
par: Bai, Qinbo, et autres
Publié: (2023)
FERN: Leveraging Graph Attention Networks for Failure Evaluation and Robust Network Design
par: Liu, Chenyi, et autres
Publié: (2023)
par: Liu, Chenyi, et autres
Publié: (2023)
Reinforced Sequential Decision-Making for Sepsis Treatment: The POSNEGDM Framework with Mortality Classifier and Transformer
par: Tamboli, Dipesh, et autres
Publié: (2024)
par: Tamboli, Dipesh, et autres
Publié: (2024)
$γ$-weakly $θ$-up-concavity: A Unified Framework for Non-Convex Optimization Beyond DR-Submodular and OSS Functions
par: Pedramfar, Mohammad, et autres
Publié: (2026)
par: Pedramfar, Mohammad, et autres
Publié: (2026)
Stochastic Submodular Bandits with Delayed Composite Anonymous Bandit Feedback
par: Pedramfar, Mohammad, et autres
Publié: (2023)
par: Pedramfar, Mohammad, et autres
Publié: (2023)
PRIVATEEDIT: A Privacy-Preserving Pipeline for Face-Centric Generative Image Editing
par: Tamboli, Dipesh, et autres
Publié: (2026)
par: Tamboli, Dipesh, et autres
Publié: (2026)
A Bi-directional Quantum Search Algorithm
par: Konar, Debanjan, et autres
Publié: (2024)
par: Konar, Debanjan, et autres
Publié: (2024)
Enhancing Robustness of Offline Reinforcement Learning Under Data Corruption via Sharpness-Aware Minimization
par: Xu, Le, et autres
Publié: (2025)
par: Xu, Le, et autres
Publié: (2025)
Bayes Adaptive Monte Carlo Tree Search for Offline Model-based Reinforcement Learning
par: Chen, Jiayu, et autres
Publié: (2024)
par: Chen, Jiayu, et autres
Publié: (2024)
Adaptive Advantage-Guided Policy Regularization for Offline Reinforcement Learning
par: Liu, Tenglong, et autres
Publié: (2024)
par: Liu, Tenglong, et autres
Publié: (2024)
BAGEL: Projection-Free Algorithm for Adversarially Constrained Online Convex Optimization
par: Lu, Yiyang, et autres
Publié: (2025)
par: Lu, Yiyang, et autres
Publié: (2025)
Augmenting generative models with biomedical knowledge graphs improves targeted drug discovery
par: Malusare, Aditya, et autres
Publié: (2025)
par: Malusare, Aditya, et autres
Publié: (2025)
Improved Bayesian Regret Bounds for Thompson Sampling in Reinforcement Learning
par: Moradipari, Ahmadreza, et autres
Publié: (2023)
par: Moradipari, Ahmadreza, et autres
Publié: (2023)
Global Convergence for Average Reward Constrained MDPs with Primal-Dual Actor Critic Algorithm
par: Xu, Yang, et autres
Publié: (2025)
par: Xu, Yang, et autres
Publié: (2025)
Stronger Approximation Guarantees for Non-Monotone γ-Weakly DR-Submodular Maximization
par: Jadav, Hareshkumar, et autres
Publié: (2026)
par: Jadav, Hareshkumar, et autres
Publié: (2026)
Offline Reinforcement Learning with Generative Trajectory Policies
par: Feng, Xinsong, et autres
Publié: (2025)
par: Feng, Xinsong, et autres
Publié: (2025)
ECPv2: Fast, Efficient, and Scalable Global Optimization of Lipschitz Functions
par: Fourati, Fares, et autres
Publié: (2025)
par: Fourati, Fares, et autres
Publié: (2025)
Stochastic Q-learning for Large Discrete Action Spaces
par: Fourati, Fares, et autres
Publié: (2024)
par: Fourati, Fares, et autres
Publié: (2024)
Order-Optimal Sample Complexity of Rectified Flows
par: Sahoo, Hari Krishna, et autres
Publié: (2026)
par: Sahoo, Hari Krishna, et autres
Publié: (2026)
A Unified Approach for Maximizing Continuous DR-submodular Functions
par: Pedramfar, Mohammad, et autres
Publié: (2023)
par: Pedramfar, Mohammad, et autres
Publié: (2023)
MALinZero: Efficient Low-Dimensional Search for Mastering Complex Multi-Agent Planning
par: Tang, Sizhe, et autres
Publié: (2025)
par: Tang, Sizhe, et autres
Publié: (2025)
Documents similaires
-
Variational Offline Multi-agent Skill Discovery
par: Chen, Jiayu, et autres
Publié: (2024) -
Quantum Speedups in Regret Analysis of Infinite Horizon Average-Reward Markov Decision Processes
par: Ganguly, Bhargav, et autres
Publié: (2023) -
Accelerating Quantum Reinforcement Learning with a Quantum Natural Policy Gradient Based Approach
par: Xu, Yang, et autres
Publié: (2025) -
A Technical Survey of Reinforcement Learning Techniques for Large Language Models
par: Srivastava, Saksham Sahai, et autres
Publié: (2025) -
Global Convergence Guarantees for Federated Policy Gradient Methods with Adversaries
par: Ganesh, Swetha, et autres
Publié: (2024)