Salvato in:
| Autore principale: | Poschl, Jacob |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2025
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2512.11829 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
Value of Information and Reward Specification in Active Inference and POMDPs
di: Wei, Ran
Pubblicazione: (2024)
di: Wei, Ran
Pubblicazione: (2024)
Beyond Inference-Time Search: Reinforcement Learning Synthesizes Reusable Solvers
di: Massoudi, Soheyl, et al.
Pubblicazione: (2026)
di: Massoudi, Soheyl, et al.
Pubblicazione: (2026)
Towards the Reusability and Compositionality of Causal Representations
di: Talon, Davide, et al.
Pubblicazione: (2024)
di: Talon, Davide, et al.
Pubblicazione: (2024)
Log-Augmented Generation: Scaling Test-Time Reasoning with Reusable Computation
di: Chen, Peter Baile, et al.
Pubblicazione: (2025)
di: Chen, Peter Baile, et al.
Pubblicazione: (2025)
Inferring Transition Dynamics from Value Functions
di: Adamczyk, Jacob
Pubblicazione: (2025)
di: Adamczyk, Jacob
Pubblicazione: (2025)
The Curvature Rate λ: A Scalar Measure of Input-Space Sharpness in Neural Networks
di: Poschl, Jacob
Pubblicazione: (2025)
di: Poschl, Jacob
Pubblicazione: (2025)
Active Timepoint Selection for Learning Measure-Valued Trajectories
di: Huynh, Nicolas, et al.
Pubblicazione: (2026)
di: Huynh, Nicolas, et al.
Pubblicazione: (2026)
Shapley-Value-Based Graph Sparsification for GNN Inference
di: Akkas, Selahattin, et al.
Pubblicazione: (2025)
di: Akkas, Selahattin, et al.
Pubblicazione: (2025)
DrS: Learning Reusable Dense Rewards for Multi-Stage Tasks
di: Mu, Tongzhou, et al.
Pubblicazione: (2024)
di: Mu, Tongzhou, et al.
Pubblicazione: (2024)
Adaptive Splitting of Reusable Temporal Monitors for Rare Traffic Violations
di: Innes, Craig, et al.
Pubblicazione: (2024)
di: Innes, Craig, et al.
Pubblicazione: (2024)
An Analysis of Action-Value Temporal-Difference Methods That Learn State Values
di: Daley, Brett, et al.
Pubblicazione: (2025)
di: Daley, Brett, et al.
Pubblicazione: (2025)
Portable Reward Tuning: Towards Reusable Fine-Tuning across Different Pretrained Models
di: Chijiwa, Daiki, et al.
Pubblicazione: (2025)
di: Chijiwa, Daiki, et al.
Pubblicazione: (2025)
Deep Active Inference Agents for Delayed and Long-Horizon Environments
di: Yeganeh, Yavar Taheri, et al.
Pubblicazione: (2025)
di: Yeganeh, Yavar Taheri, et al.
Pubblicazione: (2025)
Dropout Robustness and Cognitive Profiling of Transformer Models via Stochastic Inference
di: Caiado, Antônio Junior Alves, et al.
Pubblicazione: (2026)
di: Caiado, Antônio Junior Alves, et al.
Pubblicazione: (2026)
Feature Inference Attack on Shapley Values
di: Luo, Xinjian, et al.
Pubblicazione: (2024)
di: Luo, Xinjian, et al.
Pubblicazione: (2024)
HMVI: Unifying Heterogeneous Attributes with Natural Neighbors for Missing Value Inference
di: Luo, Xiaopeng, et al.
Pubblicazione: (2026)
di: Luo, Xiaopeng, et al.
Pubblicazione: (2026)
Active Inference Meeting Energy-Efficient Control of Parallel and Identical Machines
di: Yeganeh, Yavar Taheri, et al.
Pubblicazione: (2024)
di: Yeganeh, Yavar Taheri, et al.
Pubblicazione: (2024)
Flow-Direct: Feedback-Efficient and Reusable Guidance for Flow Models via Non-Parametric Guidance Field
di: Tan, Kim Yong, et al.
Pubblicazione: (2026)
di: Tan, Kim Yong, et al.
Pubblicazione: (2026)
Demonstrating the Continual Learning Capabilities and Practical Application of Discrete-Time Active Inference
di: Prakki, Rithvik
Pubblicazione: (2024)
di: Prakki, Rithvik
Pubblicazione: (2024)
When Thoughts Meet Facts: Reusable Reasoning for Long-Context LMs
di: Jeong, Soyeong, et al.
Pubblicazione: (2025)
di: Jeong, Soyeong, et al.
Pubblicazione: (2025)
Online Learning for Multi-Layer Hierarchical Inference under Partial and Policy-Dependent Feedback
di: Zhang, Haoran, et al.
Pubblicazione: (2026)
di: Zhang, Haoran, et al.
Pubblicazione: (2026)
Brain-like Variational Inference
di: Vafaii, Hadi, et al.
Pubblicazione: (2024)
di: Vafaii, Hadi, et al.
Pubblicazione: (2024)
Analysis of Long Range Dependency Understanding in State Space Models
di: Ravikumar, Srividya, et al.
Pubblicazione: (2026)
di: Ravikumar, Srividya, et al.
Pubblicazione: (2026)
VDSC: Enhancing Exploration Timing with Value Discrepancy and State Counts
di: Captari, Marius, et al.
Pubblicazione: (2024)
di: Captari, Marius, et al.
Pubblicazione: (2024)
Accelerating Reinforcement Learning with Value-Conditional State Entropy Exploration
di: Kim, Dongyoung, et al.
Pubblicazione: (2023)
di: Kim, Dongyoung, et al.
Pubblicazione: (2023)
Homomorphic Mappings for Value-Preserving State Aggregation in Markov Decision Processes
di: Zhao, Shuo, et al.
Pubblicazione: (2025)
di: Zhao, Shuo, et al.
Pubblicazione: (2025)
Value-State Gated Attention for Mitigating Extreme-Token Phenomena in Transformers
di: Bu, Rui, et al.
Pubblicazione: (2025)
di: Bu, Rui, et al.
Pubblicazione: (2025)
AdaGamma: State-Dependent Discounting for Temporal Adaptation in Reinforcement Learning
di: Wang, Yaomin, et al.
Pubblicazione: (2026)
di: Wang, Yaomin, et al.
Pubblicazione: (2026)
Universal Reusability in Recommender Systems: The Case for Dataset- and Task-Independent Frameworks
di: Wijaya, Tri Kurniawan, et al.
Pubblicazione: (2025)
di: Wijaya, Tri Kurniawan, et al.
Pubblicazione: (2025)
ABC3: Active Bayesian Causal Inference with Cohn Criteria in Randomized Experiments
di: Cha, Taehun, et al.
Pubblicazione: (2024)
di: Cha, Taehun, et al.
Pubblicazione: (2024)
Value Profiles for Encoding Human Variation
di: Sorensen, Taylor, et al.
Pubblicazione: (2025)
di: Sorensen, Taylor, et al.
Pubblicazione: (2025)
Active Inference for Energy Control and Planning in Smart Buildings and Communities
di: Nazemi, Seyyed Danial, et al.
Pubblicazione: (2025)
di: Nazemi, Seyyed Danial, et al.
Pubblicazione: (2025)
Active Preference Inference using Language Models and Probabilistic Reasoning
di: Piriyakulkij, Wasu Top, et al.
Pubblicazione: (2023)
di: Piriyakulkij, Wasu Top, et al.
Pubblicazione: (2023)
Concurrent Learning with Aggregated States via Randomized Least Squares Value Iteration
di: Chen, Yan, et al.
Pubblicazione: (2025)
di: Chen, Yan, et al.
Pubblicazione: (2025)
Bounding-Box Inference for Error-Aware Model-Based Reinforcement Learning
di: Talvitie, Erin J., et al.
Pubblicazione: (2024)
di: Talvitie, Erin J., et al.
Pubblicazione: (2024)
Beyond Dense States: Elevating Sparse Transcoders to Active Operators for Latent Reasoning
di: Wang, Yadong, et al.
Pubblicazione: (2026)
di: Wang, Yadong, et al.
Pubblicazione: (2026)
Active Inference and Reinforcement Learning: A unified inference on continuous state and action spaces under partial observability
di: Malekzadeh, Parvin, et al.
Pubblicazione: (2022)
di: Malekzadeh, Parvin, et al.
Pubblicazione: (2022)
Learning An Active Inference Model of Driver Perception and Control: Application to Vehicle Car-Following
di: Wei, Ran, et al.
Pubblicazione: (2023)
di: Wei, Ran, et al.
Pubblicazione: (2023)
Is Active Persona Inference Necessary for Aligning Small Models to Personal Preferences?
di: Tang, Zilu, et al.
Pubblicazione: (2025)
di: Tang, Zilu, et al.
Pubblicazione: (2025)
A Slices Perspective for Incremental Nonparametric Inference in High Dimensional State Spaces
di: Shienman, Moshe, et al.
Pubblicazione: (2024)
di: Shienman, Moshe, et al.
Pubblicazione: (2024)
Documenti analoghi
-
Value of Information and Reward Specification in Active Inference and POMDPs
di: Wei, Ran
Pubblicazione: (2024) -
Beyond Inference-Time Search: Reinforcement Learning Synthesizes Reusable Solvers
di: Massoudi, Soheyl, et al.
Pubblicazione: (2026) -
Towards the Reusability and Compositionality of Causal Representations
di: Talon, Davide, et al.
Pubblicazione: (2024) -
Log-Augmented Generation: Scaling Test-Time Reasoning with Reusable Computation
di: Chen, Peter Baile, et al.
Pubblicazione: (2025) -
Inferring Transition Dynamics from Value Functions
di: Adamczyk, Jacob
Pubblicazione: (2025)