שמור ב:
| Main Authors: | Kamat, Anand, Precup, Doina |
|---|---|
| פורמט: | Preprint |
| יצא לאור: |
2020
|
| נושאים: | |
| גישה מקוונת: | https://arxiv.org/abs/2011.02565 |
| תגים: |
הוספת תג
אין תגיות, היה/י הראשונ/ה לתייג את הרשומה!
|
פריטים דומים
Functional Acceleration for Policy Mirror Descent
מאת: Chelu, Veronica, et al.
יצא לאור: (2024)
מאת: Chelu, Veronica, et al.
יצא לאור: (2024)
A Look at Value-Based Decision-Time vs. Background Planning Methods Across Different Settings
מאת: Alver, Safa, et al.
יצא לאור: (2022)
מאת: Alver, Safa, et al.
יצא לאור: (2022)
Sparse-Reg: Improving Sample Complexity in Offline Reinforcement Learning using Sparsity
מאת: Arnob, Samin Yeasar, et al.
יצא לאור: (2025)
מאת: Arnob, Samin Yeasar, et al.
יצא לאור: (2025)
Adaptive Exploration for Data-Efficient General Value Function Evaluations
מאת: Jain, Arushi, et al.
יצא לאור: (2024)
מאת: Jain, Arushi, et al.
יצא לאור: (2024)
Partial Models for Building Adaptive Model-Based Reinforcement Learning Agents
מאת: Alver, Safa, et al.
יצא לאור: (2024)
מאת: Alver, Safa, et al.
יצא לאור: (2024)
Parseval Regularization for Continual Reinforcement Learning
מאת: Chung, Wesley, et al.
יצא לאור: (2024)
מאת: Chung, Wesley, et al.
יצא לאור: (2024)
Fluid-Agent Reinforcement Learning
מאת: Sharma, Shishir, et al.
יצא לאור: (2026)
מאת: Sharma, Shishir, et al.
יצא לאור: (2026)
Incorporating Spatial Information into Goal-Conditioned Hierarchical Reinforcement Learning via Graph Representations
מאת: Zhang, Shuyuan, et al.
יצא לאור: (2025)
מאת: Zhang, Shuyuan, et al.
יצא לאור: (2025)
Reinforcement Learning with Pairwise Preferences in Long-Term Decision Problems
מאת: Carr, Jonathan Colaço, et al.
יצא לאור: (2026)
מאת: Carr, Jonathan Colaço, et al.
יצא לאור: (2026)
Finite time analysis of temporal difference learning with linear function approximation: Tail averaging and regularisation
מאת: Patil, Gandharv, et al.
יצא לאור: (2022)
מאת: Patil, Gandharv, et al.
יצא לאור: (2022)
Policy Gradient Methods in the Presence of Symmetries and State Abstractions
מאת: Panangaden, Prakash, et al.
יצא לאור: (2023)
מאת: Panangaden, Prakash, et al.
יצא לאור: (2023)
Understanding Behavioral Metric Learning: A Large-Scale Study on Distracting Reinforcement Learning Environments
מאת: Luo, Ziyan, et al.
יצא לאור: (2025)
מאת: Luo, Ziyan, et al.
יצא לאור: (2025)
Uncovering a Universal Abstract Algorithm for Modular Addition in Neural Networks
מאת: McCracken, Gavin, et al.
יצא לאור: (2025)
מאת: McCracken, Gavin, et al.
יצא לאור: (2025)
Capacity-Constrained Continual Learning
מאת: Wen, Zheng, et al.
יצא לאור: (2025)
מאת: Wen, Zheng, et al.
יצא לאור: (2025)
Consciousness-Inspired Spatio-Temporal Abstractions for Better Generalization in Reinforcement Learning
מאת: Zhao, Mingde, et al.
יצא לאור: (2023)
מאת: Zhao, Mingde, et al.
יצא לאור: (2023)
Rotation-Preserving Supervised Fine-Tuning
מאת: Jin, Hangzhan, et al.
יצא לאור: (2026)
מאת: Jin, Hangzhan, et al.
יצא לאור: (2026)
Effective Protein-Protein Interaction Exploration with PPIretrieval
מאת: Hua, Chenqing, et al.
יצא לאור: (2024)
מאת: Hua, Chenqing, et al.
יצא לאור: (2024)
RL Fine-Tuning Heals OOD Forgetting in SFT
מאת: Jin, Hangzhan, et al.
יצא לאור: (2025)
מאת: Jin, Hangzhan, et al.
יצא לאור: (2025)
Affordances Enable Partial World Modeling with LLMs
מאת: Khetarpal, Khimya, et al.
יצא לאור: (2026)
מאת: Khetarpal, Khimya, et al.
יצא לאור: (2026)
More Efficient Randomized Exploration for Reinforcement Learning via Approximate Sampling
מאת: Ishfaq, Haque, et al.
יצא לאור: (2024)
מאת: Ishfaq, Haque, et al.
יצא לאור: (2024)
Capturing Individual Human Preferences with Reward Features
מאת: Barreto, André, et al.
יצא לאור: (2025)
מאת: Barreto, André, et al.
יצא לאור: (2025)
Mixtures of Experts Unlock Parameter Scaling for Deep RL
מאת: Obando-Ceron, Johan, et al.
יצא לאור: (2024)
מאת: Obando-Ceron, Johan, et al.
יצא לאור: (2024)
ReactZyme: A Benchmark for Enzyme-Reaction Prediction
מאת: Hua, Chenqing, et al.
יצא לאור: (2024)
מאת: Hua, Chenqing, et al.
יצא לאור: (2024)
Langevin Soft Actor-Critic: Efficient Exploration through Uncertainty-Driven Critic Learning
מאת: Ishfaq, Haque, et al.
יצא לאור: (2025)
מאת: Ishfaq, Haque, et al.
יצא לאור: (2025)
OptionZero: Planning with Learned Options
מאת: Huang, Po-Wei, et al.
יצא לאור: (2025)
מאת: Huang, Po-Wei, et al.
יצא לאור: (2025)
MaestroMotif: Skill Design from Artificial Intelligence Feedback
מאת: Klissarov, Martin, et al.
יצא לאור: (2024)
מאת: Klissarov, Martin, et al.
יצא לאור: (2024)
Quality-Diversity Actor-Critic: Learning High-Performing and Diverse Behaviors via Value and Successor Features Critics
מאת: Grillotti, Luca, et al.
יצא לאור: (2024)
מאת: Grillotti, Luca, et al.
יצא לאור: (2024)
Understanding Sparse Neural Networks from their Topology via Multipartite Graph Representations
מאת: Cunegatti, Elia, et al.
יצא לאור: (2023)
מאת: Cunegatti, Elia, et al.
יצא לאור: (2023)
Plasticity as the Mirror of Empowerment
מאת: Abel, David, et al.
יצא לאור: (2025)
מאת: Abel, David, et al.
יצא לאור: (2025)
Balancing Plasticity and Stability with Fast and Slow Successor Features
מאת: Chua, Raymond, et al.
יצא לאור: (2026)
מאת: Chua, Raymond, et al.
יצא לאור: (2026)
EnzymeFlow: Generating Reaction-specific Enzyme Catalytic Pockets through Flow Matching and Co-Evolutionary Dynamics
מאת: Hua, Chenqing, et al.
יצא לאור: (2024)
מאת: Hua, Chenqing, et al.
יצא לאור: (2024)
Cracking the Code of Action: a Generative Approach to Affordances for Reinforcement Learning
מאת: Cherif, Lynn, et al.
יצא לאור: (2025)
מאת: Cherif, Lynn, et al.
יצא לאור: (2025)
Unveiling Options with Neural Decomposition
מאת: Alikhasi, Mahdi, et al.
יצא לאור: (2024)
מאת: Alikhasi, Mahdi, et al.
יצא לאור: (2024)
On the Privacy of Selection Mechanisms with Gaussian Noise
מאת: Lebensold, Jonathan, et al.
יצא לאור: (2024)
מאת: Lebensold, Jonathan, et al.
יצא לאור: (2024)
Finding Increasingly Large Extremal Graphs with AlphaZero and Tabu Search
מאת: Mehrabian, Abbas, et al.
יצא לאור: (2023)
מאת: Mehrabian, Abbas, et al.
יצא לאור: (2023)
Scalable Option Learning in High-Throughput Environments
מאת: Henaff, Mikael, et al.
יצא לאור: (2025)
מאת: Henaff, Mikael, et al.
יצא לאור: (2025)
Flow-of-Options: Diversified and Improved LLM Reasoning by Thinking Through Options
מאת: Nair, Lakshmi, et al.
יצא לאור: (2025)
מאת: Nair, Lakshmi, et al.
יצא לאור: (2025)
Predictive Modeling and Explainable AI for Veterinary Safety Profiles, Residue Assessment, and Health Outcomes Using Real-World Data and Physicochemical Properties
מאת: Sholehrasa, Hossein, et al.
יצא לאור: (2025)
מאת: Sholehrasa, Hossein, et al.
יצא לאור: (2025)
Graph Convolutions Enrich the Self-Attention in Transformers!
מאת: Choi, Jeongwhan, et al.
יצא לאור: (2023)
מאת: Choi, Jeongwhan, et al.
יצא לאור: (2023)
Conditions on Preference Relations that Guarantee the Existence of Optimal Policies
מאת: Carr, Jonathan Colaço, et al.
יצא לאור: (2023)
מאת: Carr, Jonathan Colaço, et al.
יצא לאור: (2023)
פריטים דומים
-
Functional Acceleration for Policy Mirror Descent
מאת: Chelu, Veronica, et al.
יצא לאור: (2024) -
A Look at Value-Based Decision-Time vs. Background Planning Methods Across Different Settings
מאת: Alver, Safa, et al.
יצא לאור: (2022) -
Sparse-Reg: Improving Sample Complexity in Offline Reinforcement Learning using Sparsity
מאת: Arnob, Samin Yeasar, et al.
יצא לאור: (2025) -
Adaptive Exploration for Data-Efficient General Value Function Evaluations
מאת: Jain, Arushi, et al.
יצא לאור: (2024) -
Partial Models for Building Adaptive Model-Based Reinforcement Learning Agents
מאת: Alver, Safa, et al.
יצא לאור: (2024)