:: Library Catalog

Image de couverture de livre

Enregistré dans:

Détails bibliographiques
Auteurs principaux:	van der Vaart, Pascal R., Yorke-Smith, Neil, Spaan, Matthijs T. J.
Format:	Preprint
Publié:	2025
Sujets:	Machine Learning Artificial Intelligence
Accès en ligne:	https://arxiv.org/abs/2508.21488
Tags:	Ajouter un tag Pas de tags, Soyez le premier à ajouter un tag!

Documents similaires

On the Equivalence of Random Network Distillation, Deep Ensembles, and Bayesian Inference
par: Zanger, Moritz A., et autres
Publié: (2026)

Contextual Similarity Distillation: Ensemble Uncertainties with a Single Model
par: Zanger, Moritz A., et autres
Publié: (2025)

Twice Sequential Monte Carlo for Tree Search
par: Oren, Yaniv, et autres
Publié: (2025)

Value Improved Actor Critic Algorithms
par: Oren, Yaniv, et autres
Publié: (2024)

Universal Value-Function Uncertainties
par: Zanger, Moritz A., et autres
Publié: (2025)

Explore-Go: Leveraging Exploration for Generalisation in Deep Reinforcement Learning
par: Weltevrede, Max, et autres
Publié: (2024)

Diverse Projection Ensembles for Distributional Reinforcement Learning
par: Zanger, Moritz A., et autres
Publié: (2023)

How Ensembles of Distilled Policies Improve Generalisation in Reinforcement Learning
par: Weltevrede, Max, et autres
Publié: (2025)

Positive Experience Reflection for Agents in Interactive Text Environments
par: Lippmann, Philip, et autres
Publié: (2024)

Epistemic Monte Carlo Tree Search
par: Oren, Yaniv, et autres
Publié: (2022)

Exploration Implies Data Augmentation: Reachability and Generalisation in Contextual MDPs
par: Weltevrede, Max, et autres
Publié: (2024)

RecBayes: Recurrent Bayesian Ad Hoc Teamwork in Large Partially Observable Domains
par: Ribeiro, João G., et autres
Publié: (2025)

VariBASed: Variational Bayes-Adaptive Sequential Monte-Carlo Planning for Deep Reinforcement Learning
par: de Vries, Joery A., et autres
Publié: (2026)

Learning optimal objective values for MILP
par: Scavuzzo, Lara, et autres
Publié: (2024)

Reinforcement Learning by Guided Safe Exploration
par: Yang, Qisong, et autres
Publié: (2023)

Partial Identifiability and Misspecification in Inverse Reinforcement Learning
par: Skalse, Joar, et autres
Publié: (2024)

Detecting Model Misspecification in Amortized Bayesian Inference with Neural Networks: An Extended Investigation
par: Schmitt, Marvin, et autres
Publié: (2024)

Efficient Imitation under Misspecification
par: Espinosa-Dice, Nicolas, et autres
Publié: (2025)

Pessimistic Iterative Planning with RNNs for Robust POMDPs
par: Galesloot, Maris F. L., et autres
Publié: (2024)

FSP-Laplace: Function-Space Priors for the Laplace Approximation in Bayesian Deep Learning
par: Cinquin, Tristan, et autres
Publié: (2024)

Towards Automated Self-Supervised Learning for Truly Unsupervised Graph Anomaly Detection
par: Li, Zhong, et autres
Publié: (2025)

Online Incident Response Planning under Model Misspecification through Bayesian Learning and Belief Quantization
par: Hammar, Kim, et autres
Publié: (2025)

Not All Explanations for Deep Learning Phenomena Are Equally Valuable
par: Jeffares, Alan, et autres
Publié: (2025)

Causal Deep Learning
par: Berrevoets, Jeroen, et autres
Publié: (2023)

FlowQ: Energy-Guided Flow Policies for Offline Reinforcement Learning
par: Alles, Marvin, et autres
Publié: (2025)

Double Successive Over-Relaxation Q-Learning with an Extension to Deep Reinforcement Learning
par: R, Shreyas S
Publié: (2024)

Expectation Alignment: Handling Reward Misspecification in the Presence of Expectation Mismatch
par: Mechergui, Malek, et autres
Publié: (2024)

Beyond Prior Limits: Addressing Distribution Misalignment in Particle Filtering
par: Shi, Yiwei, et autres
Publié: (2025)

Simulation Priors for Data-Efficient Deep Learning
par: Treven, Lenart, et autres
Publié: (2025)

Addressing Spectral Bias of Deep Neural Networks by Multi-Grade Deep Learning
par: Fang, Ronglong, et autres
Publié: (2024)

In-Context Reinforcement Learning through Bayesian Fusion of Context and Value Prior
par: Berkes, Anaïs, et autres
Publié: (2026)

Is Elo Rating Reliable? A Study Under Model Misspecification
par: Tang, Shange, et autres
Publié: (2025)

Epistemic Traps: Rational Misalignment Driven by Model Misspecification
par: Xu, Xingcheng, et autres
Publié: (2026)

Large Language Models to Enhance Bayesian Optimization
par: Liu, Tennison, et autres
Publié: (2024)

Position: The Future of Bayesian Prediction Is Prior-Fitted
par: Müller, Samuel, et autres
Publié: (2025)

Bayesian Concept Bottleneck Models with LLM Priors
par: Feng, Jean, et autres
Publié: (2024)

Collapsed Inference for Bayesian Deep Learning
par: Zeng, Zhe, et autres
Publié: (2023)

Deep Learning Through A Telescoping Lens: A Simple Model Provides Empirical Insights On Grokking, Gradient Boosting & Beyond
par: Jeffares, Alan, et autres
Publié: (2024)

$β$-DQN: Improving Deep Q-Learning By Evolving the Behavior
par: Zhang, Hongming, et autres
Publié: (2025)

Learning Distinguishable Representations in Deep Q-Networks for Linear Transfer
par: Sathish, Sooraj, et autres
Publié: (2025)