Salvato in:
| Autori principali: | Konsta, Alyzia-Maria, Lafuente, Alberto Lluch, Matheja, Christoph |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2024
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2405.10768 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
Trust Management for Internet of Things: A Systematic Literature Review
di: Konsta, Alyzia Maria, et al.
Pubblicazione: (2022)
di: Konsta, Alyzia Maria, et al.
Pubblicazione: (2022)
Scaling Observation-aware Planning in Uncertain Domains
di: Zvizdenco, Adrian, et al.
Pubblicazione: (2026)
di: Zvizdenco, Adrian, et al.
Pubblicazione: (2026)
Attack Tree Generation via Process Mining
di: Konsta, Alyzia-Maria, et al.
Pubblicazione: (2024)
di: Konsta, Alyzia-Maria, et al.
Pubblicazione: (2024)
Data Petri Nets meet Probabilistic Programming (Extended version)
di: Kuhn, Martin, et al.
Pubblicazione: (2024)
di: Kuhn, Martin, et al.
Pubblicazione: (2024)
Information-theoretic analysis of world models in optimal reward maximizers
di: Harwood, Alfred, et al.
Pubblicazione: (2026)
di: Harwood, Alfred, et al.
Pubblicazione: (2026)
What should an AI assessor optimise for?
di: Romero-Alvarado, Daniel, et al.
Pubblicazione: (2025)
di: Romero-Alvarado, Daniel, et al.
Pubblicazione: (2025)
Tighter Value-Function Approximations for POMDPs
di: Krale, Merlijn, et al.
Pubblicazione: (2025)
di: Krale, Merlijn, et al.
Pubblicazione: (2025)
Rethinking Transformers in Solving POMDPs
di: Lu, Chenhao, et al.
Pubblicazione: (2024)
di: Lu, Chenhao, et al.
Pubblicazione: (2024)
Agile Retrospectives: What went well? What didn't go well? What should we do?
di: Spichkova, Maria, et al.
Pubblicazione: (2025)
di: Spichkova, Maria, et al.
Pubblicazione: (2025)
Simplification of Risk Averse POMDPs with Performance Guarantees
di: Pariente, Yaacov, et al.
Pubblicazione: (2024)
di: Pariente, Yaacov, et al.
Pubblicazione: (2024)
Multi-Environment POMDPs with Finite-Horizon Objectives
di: Brice, Léonard, et al.
Pubblicazione: (2026)
di: Brice, Léonard, et al.
Pubblicazione: (2026)
Planning under Distribution Shifts with Causal POMDPs
di: Ceriscioli, Matteo, et al.
Pubblicazione: (2026)
di: Ceriscioli, Matteo, et al.
Pubblicazione: (2026)
Online Planning in POMDPs with State-Requests
di: Avalos, Raphael, et al.
Pubblicazione: (2024)
di: Avalos, Raphael, et al.
Pubblicazione: (2024)
Belief-State Query Policies for User-Aligned POMDPs
di: Bramblett, Daniel, et al.
Pubblicazione: (2024)
di: Bramblett, Daniel, et al.
Pubblicazione: (2024)
Scalable Solution Methods for Dec-POMDPs with Deterministic Dynamics
di: You, Yang, et al.
Pubblicazione: (2025)
di: You, Yang, et al.
Pubblicazione: (2025)
Just Say What You Want: Only-prompting Self-rewarding Online Preference Optimization
di: Xu, Ruijie, et al.
Pubblicazione: (2024)
di: Xu, Ruijie, et al.
Pubblicazione: (2024)
Learning Logic Specifications for Policy Guidance in POMDPs: an Inductive Logic Programming Approach
di: Meli, Daniele, et al.
Pubblicazione: (2024)
di: Meli, Daniele, et al.
Pubblicazione: (2024)
Pessimistic Iterative Planning with RNNs for Robust POMDPs
di: Galesloot, Maris F. L., et al.
Pubblicazione: (2024)
di: Galesloot, Maris F. L., et al.
Pubblicazione: (2024)
Factored Online Planning in Many-Agent POMDPs
di: Galesloot, Maris F. L., et al.
Pubblicazione: (2023)
di: Galesloot, Maris F. L., et al.
Pubblicazione: (2023)
Scalable Policy-Based RL Algorithms for POMDPs
di: Anjarlekar, Ameya, et al.
Pubblicazione: (2025)
di: Anjarlekar, Ameya, et al.
Pubblicazione: (2025)
ARCA: Adapter-Residual Credit Assignment When Token Signals Degenerate
di: Lafuente-Mercado, Rodney
Pubblicazione: (2026)
di: Lafuente-Mercado, Rodney
Pubblicazione: (2026)
Adaptive Policy Synchronization for Scalable Reinforcement Learning
di: Lafuente-Mercado, Rodney
Pubblicazione: (2025)
di: Lafuente-Mercado, Rodney
Pubblicazione: (2025)
Inducing Individual Students' Learning Strategies through Homomorphic POMDPs
di: Gao, Huifan, et al.
Pubblicazione: (2024)
di: Gao, Huifan, et al.
Pubblicazione: (2024)
Shift-Up: A Framework for Software Engineering Guardrails in AI-native Software Development -- Initial Findings
di: Lipsanen, Petrus, et al.
Pubblicazione: (2026)
di: Lipsanen, Petrus, et al.
Pubblicazione: (2026)
Value of Information and Reward Specification in Active Inference and POMDPs
di: Wei, Ran
Pubblicazione: (2024)
di: Wei, Ran
Pubblicazione: (2024)
How to Explore with Belief: State Entropy Maximization in POMDPs
di: Zamboni, Riccardo, et al.
Pubblicazione: (2024)
di: Zamboni, Riccardo, et al.
Pubblicazione: (2024)
Missingness-MDPs: Bridging the Theory of Missing Data and POMDPs
di: Wendland, Joshua, et al.
Pubblicazione: (2026)
di: Wendland, Joshua, et al.
Pubblicazione: (2026)
Optimizing Task Completion Time Updates Using POMDPs
di: Eddy, Duncan, et al.
Pubblicazione: (2026)
di: Eddy, Duncan, et al.
Pubblicazione: (2026)
Sequential Monte Carlo for Policy Optimization in Continuous POMDPs
di: Abdulsamad, Hany, et al.
Pubblicazione: (2025)
di: Abdulsamad, Hany, et al.
Pubblicazione: (2025)
Multi-Environment POMDPs: Discrete Model Uncertainty Under Partial Observability
di: Bovy, Eline M., et al.
Pubblicazione: (2025)
di: Bovy, Eline M., et al.
Pubblicazione: (2025)
Computing the Reachability Value of Posterior-Deterministic POMDPs
di: Fijalkow, Nathanaël, et al.
Pubblicazione: (2026)
di: Fijalkow, Nathanaël, et al.
Pubblicazione: (2026)
Point-Based Value Iteration for POMDPs with Neural Perception Mechanisms
di: Yan, Rui, et al.
Pubblicazione: (2023)
di: Yan, Rui, et al.
Pubblicazione: (2023)
Robust Finite-Memory Policy Gradients for Hidden-Model POMDPs
di: Galesloot, Maris F. L., et al.
Pubblicazione: (2025)
di: Galesloot, Maris F. L., et al.
Pubblicazione: (2025)
Finite-State Controllers for (Hidden-Model) POMDPs using Deep Reinforcement Learning
di: Hudák, David, et al.
Pubblicazione: (2026)
di: Hudák, David, et al.
Pubblicazione: (2026)
Synthetic POMDPs to Challenge Memory-Augmented RL: Memory Demand Structure Modeling
di: Wang, Yongyi, et al.
Pubblicazione: (2025)
di: Wang, Yongyi, et al.
Pubblicazione: (2025)
Active teacher selection for reward learning
di: Freedman, Rachel, et al.
Pubblicazione: (2023)
di: Freedman, Rachel, et al.
Pubblicazione: (2023)
Self-rewarding correction for mathematical reasoning
di: Xiong, Wei, et al.
Pubblicazione: (2025)
di: Xiong, Wei, et al.
Pubblicazione: (2025)
Noise-based reward-modulated learning
di: Fernández, Jesús García, et al.
Pubblicazione: (2025)
di: Fernández, Jesús García, et al.
Pubblicazione: (2025)
GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization
di: Liu, Shih-Yang, et al.
Pubblicazione: (2026)
di: Liu, Shih-Yang, et al.
Pubblicazione: (2026)
Online Risk-Averse Planning in POMDPs Using Iterated CVaR Value Function
di: Pariente, Yaacov, et al.
Pubblicazione: (2026)
di: Pariente, Yaacov, et al.
Pubblicazione: (2026)
Documenti analoghi
-
Trust Management for Internet of Things: A Systematic Literature Review
di: Konsta, Alyzia Maria, et al.
Pubblicazione: (2022) -
Scaling Observation-aware Planning in Uncertain Domains
di: Zvizdenco, Adrian, et al.
Pubblicazione: (2026) -
Attack Tree Generation via Process Mining
di: Konsta, Alyzia-Maria, et al.
Pubblicazione: (2024) -
Data Petri Nets meet Probabilistic Programming (Extended version)
di: Kuhn, Martin, et al.
Pubblicazione: (2024) -
Information-theoretic analysis of world models in optimal reward maximizers
di: Harwood, Alfred, et al.
Pubblicazione: (2026)