Enregistré dans:
| Auteurs principaux: | van der Vaart, Pascal R., Yorke-Smith, Neil, Spaan, Matthijs T. J. |
|---|---|
| Format: | Preprint |
| Publié: |
2025
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2508.21488 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
On the Equivalence of Random Network Distillation, Deep Ensembles, and Bayesian Inference
par: Zanger, Moritz A., et autres
Publié: (2026)
par: Zanger, Moritz A., et autres
Publié: (2026)
Contextual Similarity Distillation: Ensemble Uncertainties with a Single Model
par: Zanger, Moritz A., et autres
Publié: (2025)
par: Zanger, Moritz A., et autres
Publié: (2025)
Twice Sequential Monte Carlo for Tree Search
par: Oren, Yaniv, et autres
Publié: (2025)
par: Oren, Yaniv, et autres
Publié: (2025)
Value Improved Actor Critic Algorithms
par: Oren, Yaniv, et autres
Publié: (2024)
par: Oren, Yaniv, et autres
Publié: (2024)
Universal Value-Function Uncertainties
par: Zanger, Moritz A., et autres
Publié: (2025)
par: Zanger, Moritz A., et autres
Publié: (2025)
Explore-Go: Leveraging Exploration for Generalisation in Deep Reinforcement Learning
par: Weltevrede, Max, et autres
Publié: (2024)
par: Weltevrede, Max, et autres
Publié: (2024)
Diverse Projection Ensembles for Distributional Reinforcement Learning
par: Zanger, Moritz A., et autres
Publié: (2023)
par: Zanger, Moritz A., et autres
Publié: (2023)
How Ensembles of Distilled Policies Improve Generalisation in Reinforcement Learning
par: Weltevrede, Max, et autres
Publié: (2025)
par: Weltevrede, Max, et autres
Publié: (2025)
Positive Experience Reflection for Agents in Interactive Text Environments
par: Lippmann, Philip, et autres
Publié: (2024)
par: Lippmann, Philip, et autres
Publié: (2024)
Epistemic Monte Carlo Tree Search
par: Oren, Yaniv, et autres
Publié: (2022)
par: Oren, Yaniv, et autres
Publié: (2022)
Exploration Implies Data Augmentation: Reachability and Generalisation in Contextual MDPs
par: Weltevrede, Max, et autres
Publié: (2024)
par: Weltevrede, Max, et autres
Publié: (2024)
RecBayes: Recurrent Bayesian Ad Hoc Teamwork in Large Partially Observable Domains
par: Ribeiro, João G., et autres
Publié: (2025)
par: Ribeiro, João G., et autres
Publié: (2025)
VariBASed: Variational Bayes-Adaptive Sequential Monte-Carlo Planning for Deep Reinforcement Learning
par: de Vries, Joery A., et autres
Publié: (2026)
par: de Vries, Joery A., et autres
Publié: (2026)
Learning optimal objective values for MILP
par: Scavuzzo, Lara, et autres
Publié: (2024)
par: Scavuzzo, Lara, et autres
Publié: (2024)
Reinforcement Learning by Guided Safe Exploration
par: Yang, Qisong, et autres
Publié: (2023)
par: Yang, Qisong, et autres
Publié: (2023)
Partial Identifiability and Misspecification in Inverse Reinforcement Learning
par: Skalse, Joar, et autres
Publié: (2024)
par: Skalse, Joar, et autres
Publié: (2024)
Detecting Model Misspecification in Amortized Bayesian Inference with Neural Networks: An Extended Investigation
par: Schmitt, Marvin, et autres
Publié: (2024)
par: Schmitt, Marvin, et autres
Publié: (2024)
Efficient Imitation under Misspecification
par: Espinosa-Dice, Nicolas, et autres
Publié: (2025)
par: Espinosa-Dice, Nicolas, et autres
Publié: (2025)
Pessimistic Iterative Planning with RNNs for Robust POMDPs
par: Galesloot, Maris F. L., et autres
Publié: (2024)
par: Galesloot, Maris F. L., et autres
Publié: (2024)
FSP-Laplace: Function-Space Priors for the Laplace Approximation in Bayesian Deep Learning
par: Cinquin, Tristan, et autres
Publié: (2024)
par: Cinquin, Tristan, et autres
Publié: (2024)
Towards Automated Self-Supervised Learning for Truly Unsupervised Graph Anomaly Detection
par: Li, Zhong, et autres
Publié: (2025)
par: Li, Zhong, et autres
Publié: (2025)
Online Incident Response Planning under Model Misspecification through Bayesian Learning and Belief Quantization
par: Hammar, Kim, et autres
Publié: (2025)
par: Hammar, Kim, et autres
Publié: (2025)
Not All Explanations for Deep Learning Phenomena Are Equally Valuable
par: Jeffares, Alan, et autres
Publié: (2025)
par: Jeffares, Alan, et autres
Publié: (2025)
Causal Deep Learning
par: Berrevoets, Jeroen, et autres
Publié: (2023)
par: Berrevoets, Jeroen, et autres
Publié: (2023)
FlowQ: Energy-Guided Flow Policies for Offline Reinforcement Learning
par: Alles, Marvin, et autres
Publié: (2025)
par: Alles, Marvin, et autres
Publié: (2025)
Double Successive Over-Relaxation Q-Learning with an Extension to Deep Reinforcement Learning
par: R, Shreyas S
Publié: (2024)
par: R, Shreyas S
Publié: (2024)
Expectation Alignment: Handling Reward Misspecification in the Presence of Expectation Mismatch
par: Mechergui, Malek, et autres
Publié: (2024)
par: Mechergui, Malek, et autres
Publié: (2024)
Beyond Prior Limits: Addressing Distribution Misalignment in Particle Filtering
par: Shi, Yiwei, et autres
Publié: (2025)
par: Shi, Yiwei, et autres
Publié: (2025)
Simulation Priors for Data-Efficient Deep Learning
par: Treven, Lenart, et autres
Publié: (2025)
par: Treven, Lenart, et autres
Publié: (2025)
Addressing Spectral Bias of Deep Neural Networks by Multi-Grade Deep Learning
par: Fang, Ronglong, et autres
Publié: (2024)
par: Fang, Ronglong, et autres
Publié: (2024)
In-Context Reinforcement Learning through Bayesian Fusion of Context and Value Prior
par: Berkes, Anaïs, et autres
Publié: (2026)
par: Berkes, Anaïs, et autres
Publié: (2026)
Is Elo Rating Reliable? A Study Under Model Misspecification
par: Tang, Shange, et autres
Publié: (2025)
par: Tang, Shange, et autres
Publié: (2025)
Epistemic Traps: Rational Misalignment Driven by Model Misspecification
par: Xu, Xingcheng, et autres
Publié: (2026)
par: Xu, Xingcheng, et autres
Publié: (2026)
Large Language Models to Enhance Bayesian Optimization
par: Liu, Tennison, et autres
Publié: (2024)
par: Liu, Tennison, et autres
Publié: (2024)
Position: The Future of Bayesian Prediction Is Prior-Fitted
par: Müller, Samuel, et autres
Publié: (2025)
par: Müller, Samuel, et autres
Publié: (2025)
Bayesian Concept Bottleneck Models with LLM Priors
par: Feng, Jean, et autres
Publié: (2024)
par: Feng, Jean, et autres
Publié: (2024)
Collapsed Inference for Bayesian Deep Learning
par: Zeng, Zhe, et autres
Publié: (2023)
par: Zeng, Zhe, et autres
Publié: (2023)
Deep Learning Through A Telescoping Lens: A Simple Model Provides Empirical Insights On Grokking, Gradient Boosting & Beyond
par: Jeffares, Alan, et autres
Publié: (2024)
par: Jeffares, Alan, et autres
Publié: (2024)
$β$-DQN: Improving Deep Q-Learning By Evolving the Behavior
par: Zhang, Hongming, et autres
Publié: (2025)
par: Zhang, Hongming, et autres
Publié: (2025)
Learning Distinguishable Representations in Deep Q-Networks for Linear Transfer
par: Sathish, Sooraj, et autres
Publié: (2025)
par: Sathish, Sooraj, et autres
Publié: (2025)
Documents similaires
-
On the Equivalence of Random Network Distillation, Deep Ensembles, and Bayesian Inference
par: Zanger, Moritz A., et autres
Publié: (2026) -
Contextual Similarity Distillation: Ensemble Uncertainties with a Single Model
par: Zanger, Moritz A., et autres
Publié: (2025) -
Twice Sequential Monte Carlo for Tree Search
par: Oren, Yaniv, et autres
Publié: (2025) -
Value Improved Actor Critic Algorithms
par: Oren, Yaniv, et autres
Publié: (2024) -
Universal Value-Function Uncertainties
par: Zanger, Moritz A., et autres
Publié: (2025)