:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autori principali:	Konsta, Alyzia-Maria, Lafuente, Alberto Lluch, Matheja, Christoph
Natura:	Preprint
Pubblicazione:	2024
Soggetti:	Artificial Intelligence
Accesso online:	https://arxiv.org/abs/2405.10768
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

Trust Management for Internet of Things: A Systematic Literature Review
di: Konsta, Alyzia Maria, et al.
Pubblicazione: (2022)

Scaling Observation-aware Planning in Uncertain Domains
di: Zvizdenco, Adrian, et al.
Pubblicazione: (2026)

Attack Tree Generation via Process Mining
di: Konsta, Alyzia-Maria, et al.
Pubblicazione: (2024)

Data Petri Nets meet Probabilistic Programming (Extended version)
di: Kuhn, Martin, et al.
Pubblicazione: (2024)

Information-theoretic analysis of world models in optimal reward maximizers
di: Harwood, Alfred, et al.
Pubblicazione: (2026)

What should an AI assessor optimise for?
di: Romero-Alvarado, Daniel, et al.
Pubblicazione: (2025)

Tighter Value-Function Approximations for POMDPs
di: Krale, Merlijn, et al.
Pubblicazione: (2025)

Rethinking Transformers in Solving POMDPs
di: Lu, Chenhao, et al.
Pubblicazione: (2024)

Agile Retrospectives: What went well? What didn't go well? What should we do?
di: Spichkova, Maria, et al.
Pubblicazione: (2025)

Simplification of Risk Averse POMDPs with Performance Guarantees
di: Pariente, Yaacov, et al.
Pubblicazione: (2024)

Multi-Environment POMDPs with Finite-Horizon Objectives
di: Brice, Léonard, et al.
Pubblicazione: (2026)

Planning under Distribution Shifts with Causal POMDPs
di: Ceriscioli, Matteo, et al.
Pubblicazione: (2026)

Online Planning in POMDPs with State-Requests
di: Avalos, Raphael, et al.
Pubblicazione: (2024)

Belief-State Query Policies for User-Aligned POMDPs
di: Bramblett, Daniel, et al.
Pubblicazione: (2024)

Scalable Solution Methods for Dec-POMDPs with Deterministic Dynamics
di: You, Yang, et al.
Pubblicazione: (2025)

Just Say What You Want: Only-prompting Self-rewarding Online Preference Optimization
di: Xu, Ruijie, et al.
Pubblicazione: (2024)

Learning Logic Specifications for Policy Guidance in POMDPs: an Inductive Logic Programming Approach
di: Meli, Daniele, et al.
Pubblicazione: (2024)

Pessimistic Iterative Planning with RNNs for Robust POMDPs
di: Galesloot, Maris F. L., et al.
Pubblicazione: (2024)

Factored Online Planning in Many-Agent POMDPs
di: Galesloot, Maris F. L., et al.
Pubblicazione: (2023)

Scalable Policy-Based RL Algorithms for POMDPs
di: Anjarlekar, Ameya, et al.
Pubblicazione: (2025)

ARCA: Adapter-Residual Credit Assignment When Token Signals Degenerate
di: Lafuente-Mercado, Rodney
Pubblicazione: (2026)

Adaptive Policy Synchronization for Scalable Reinforcement Learning
di: Lafuente-Mercado, Rodney
Pubblicazione: (2025)

Inducing Individual Students' Learning Strategies through Homomorphic POMDPs
di: Gao, Huifan, et al.
Pubblicazione: (2024)

Shift-Up: A Framework for Software Engineering Guardrails in AI-native Software Development -- Initial Findings
di: Lipsanen, Petrus, et al.
Pubblicazione: (2026)

Value of Information and Reward Specification in Active Inference and POMDPs
di: Wei, Ran
Pubblicazione: (2024)

How to Explore with Belief: State Entropy Maximization in POMDPs
di: Zamboni, Riccardo, et al.
Pubblicazione: (2024)

Missingness-MDPs: Bridging the Theory of Missing Data and POMDPs
di: Wendland, Joshua, et al.
Pubblicazione: (2026)

Optimizing Task Completion Time Updates Using POMDPs
di: Eddy, Duncan, et al.
Pubblicazione: (2026)

Sequential Monte Carlo for Policy Optimization in Continuous POMDPs
di: Abdulsamad, Hany, et al.
Pubblicazione: (2025)

Multi-Environment POMDPs: Discrete Model Uncertainty Under Partial Observability
di: Bovy, Eline M., et al.
Pubblicazione: (2025)

Computing the Reachability Value of Posterior-Deterministic POMDPs
di: Fijalkow, Nathanaël, et al.
Pubblicazione: (2026)

Point-Based Value Iteration for POMDPs with Neural Perception Mechanisms
di: Yan, Rui, et al.
Pubblicazione: (2023)

Robust Finite-Memory Policy Gradients for Hidden-Model POMDPs
di: Galesloot, Maris F. L., et al.
Pubblicazione: (2025)

Finite-State Controllers for (Hidden-Model) POMDPs using Deep Reinforcement Learning
di: Hudák, David, et al.
Pubblicazione: (2026)

Synthetic POMDPs to Challenge Memory-Augmented RL: Memory Demand Structure Modeling
di: Wang, Yongyi, et al.
Pubblicazione: (2025)

Active teacher selection for reward learning
di: Freedman, Rachel, et al.
Pubblicazione: (2023)

Self-rewarding correction for mathematical reasoning
di: Xiong, Wei, et al.
Pubblicazione: (2025)

Noise-based reward-modulated learning
di: Fernández, Jesús García, et al.
Pubblicazione: (2025)

GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization
di: Liu, Shih-Yang, et al.
Pubblicazione: (2026)

Online Risk-Averse Planning in POMDPs Using Iterated CVaR Value Function
di: Pariente, Yaacov, et al.
Pubblicazione: (2026)