:: Library Catalog

Image de couverture de livre

Enregistré dans:

Détails bibliographiques
Auteurs principaux:	Chen, Jiayu, Ganguly, Bhargav, Xu, Yang, Mei, Yongsheng, Lan, Tian, Aggarwal, Vaneet
Format:	Preprint
Publié:	2024
Sujets:	Machine Learning Artificial Intelligence
Accès en ligne:	https://arxiv.org/abs/2402.13777
Tags:	Ajouter un tag Pas de tags, Soyez le premier à ajouter un tag!

Documents similaires

Variational Offline Multi-agent Skill Discovery
par: Chen, Jiayu, et autres
Publié: (2024)

Quantum Speedups in Regret Analysis of Infinite Horizon Average-Reward Markov Decision Processes
par: Ganguly, Bhargav, et autres
Publié: (2023)

Accelerating Quantum Reinforcement Learning with a Quantum Natural Policy Gradient Based Approach
par: Xu, Yang, et autres
Publié: (2025)

A Technical Survey of Reinforcement Learning Techniques for Large Language Models
par: Srivastava, Saksham Sahai, et autres
Publié: (2025)

Global Convergence Guarantees for Federated Policy Gradient Methods with Adversaries
par: Ganesh, Swetha, et autres
Publié: (2024)

Network Diffuser for Placing-Scheduling Service Function Chains with Inverse Demonstration
par: Zhang, Zuyuan, et autres
Publié: (2025)

Last-Iterate Convergence of General Parameterized Policies in Constrained MDPs
par: Mondal, Washim Uddin, et autres
Publié: (2024)

Learning General Parameterized Policies for Infinite Horizon Average Reward Constrained MDPs via Primal-Dual Policy Gradient Algorithm
par: Bai, Qinbo, et autres
Publié: (2024)

Efficient $Q$-Learning and Actor-Critic Methods for Robust Average Reward Reinforcement Learning
par: Xu, Yang, et autres
Publié: (2025)

Improved Sample Complexity Analysis of Natural Policy Gradient Algorithm with General Parameterization for Infinite Horizon Discounted Reward Markov Decision Processes
par: Mondal, Washim Uddin, et autres
Publié: (2023)

Discrete State Diffusion Models: A Sample Complexity Perspective
par: Srikanth, Aadithya, et autres
Publié: (2025)

Sample-Efficient Constrained Reinforcement Learning with General Parameterization
par: Mondal, Washim Uddin, et autres
Publié: (2024)

Joint Optimization of Multi-Objective Reinforcement Learning with Policy Gradient Based Algorithm
par: Bai, Qinbo, et autres
Publié: (2021)

Sample Complexity Analysis for Constrained Bilevel Reinforcement Learning
par: Saxena, Naman, et autres
Publié: (2026)

Rack Position Optimization in Large-Scale Heterogeneous Data Centers
par: Chen, Chang-Lin, et autres
Publié: (2025)

Policy-Driven World Model Adaptation for Robust Offline Model-based Reinforcement Learning
par: Chen, Jiayu, et autres
Publié: (2025)

Don't Freeze, Don't Crash: Extending the Safe Operating Range of Neural Navigation in Dense Crowds
par: Zhang, Jiefu, et autres
Publié: (2026)

Achieving Zero Constraint Violation for Constrained Reinforcement Learning via Conservative Natural Policy Gradient Primal-Dual Algorithm
par: Bai, Qinbo, et autres
Publié: (2022)

Constrained Reinforcement Learning with Average Reward Objective: Model-Based and Model-Free Algorithms
par: Aggarwal, Vaneet, et autres
Publié: (2024)

Regret Analysis of Policy Gradient Algorithm for Infinite Horizon Average Reward Markov Decision Processes
par: Bai, Qinbo, et autres
Publié: (2023)

FERN: Leveraging Graph Attention Networks for Failure Evaluation and Robust Network Design
par: Liu, Chenyi, et autres
Publié: (2023)

Reinforced Sequential Decision-Making for Sepsis Treatment: The POSNEGDM Framework with Mortality Classifier and Transformer
par: Tamboli, Dipesh, et autres
Publié: (2024)

$γ$-weakly $θ$-up-concavity: A Unified Framework for Non-Convex Optimization Beyond DR-Submodular and OSS Functions
par: Pedramfar, Mohammad, et autres
Publié: (2026)

Stochastic Submodular Bandits with Delayed Composite Anonymous Bandit Feedback
par: Pedramfar, Mohammad, et autres
Publié: (2023)

PRIVATEEDIT: A Privacy-Preserving Pipeline for Face-Centric Generative Image Editing
par: Tamboli, Dipesh, et autres
Publié: (2026)

A Bi-directional Quantum Search Algorithm
par: Konar, Debanjan, et autres
Publié: (2024)

Enhancing Robustness of Offline Reinforcement Learning Under Data Corruption via Sharpness-Aware Minimization
par: Xu, Le, et autres
Publié: (2025)

Bayes Adaptive Monte Carlo Tree Search for Offline Model-based Reinforcement Learning
par: Chen, Jiayu, et autres
Publié: (2024)

Adaptive Advantage-Guided Policy Regularization for Offline Reinforcement Learning
par: Liu, Tenglong, et autres
Publié: (2024)

BAGEL: Projection-Free Algorithm for Adversarially Constrained Online Convex Optimization
par: Lu, Yiyang, et autres
Publié: (2025)

Augmenting generative models with biomedical knowledge graphs improves targeted drug discovery
par: Malusare, Aditya, et autres
Publié: (2025)

Improved Bayesian Regret Bounds for Thompson Sampling in Reinforcement Learning
par: Moradipari, Ahmadreza, et autres
Publié: (2023)

Global Convergence for Average Reward Constrained MDPs with Primal-Dual Actor Critic Algorithm
par: Xu, Yang, et autres
Publié: (2025)

Stronger Approximation Guarantees for Non-Monotone γ-Weakly DR-Submodular Maximization
par: Jadav, Hareshkumar, et autres
Publié: (2026)

Offline Reinforcement Learning with Generative Trajectory Policies
par: Feng, Xinsong, et autres
Publié: (2025)

ECPv2: Fast, Efficient, and Scalable Global Optimization of Lipschitz Functions
par: Fourati, Fares, et autres
Publié: (2025)

Stochastic Q-learning for Large Discrete Action Spaces
par: Fourati, Fares, et autres
Publié: (2024)

Order-Optimal Sample Complexity of Rectified Flows
par: Sahoo, Hari Krishna, et autres
Publié: (2026)

A Unified Approach for Maximizing Continuous DR-submodular Functions
par: Pedramfar, Mohammad, et autres
Publié: (2023)

MALinZero: Efficient Low-Dimensional Search for Mastering Complex Multi-Agent Planning
par: Tang, Sizhe, et autres
Publié: (2025)