:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autori principali:	Ebi, Daniel, Lambrechts, Gaspard, Ernst, Damien, Böhm, Klemens
Natura:	Preprint
Pubblicazione:	2025
Soggetti:	Machine Learning
Accesso online:	https://arxiv.org/abs/2509.26000
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

A Theoretical Justification for Asymmetric Actor-Critic Algorithms
di: Lambrechts, Gaspard, et al.
Pubblicazione: (2025)

Informed POMDP: Leveraging Additional Information in Model-Based RL
di: Lambrechts, Gaspard, et al.
Pubblicazione: (2023)

Maximum-Entropy Exploration with Future State-Action Visitation Measures
di: Bolland, Adrien, et al.
Pubblicazione: (2026)

Off-Policy Maximum Entropy RL with Future State and Action Visitation Measures
di: Bolland, Adrien, et al.
Pubblicazione: (2024)

Behind the Myth of Exploration in Policy Gradients
di: Bolland, Adrien, et al.
Pubblicazione: (2024)

Parallelizing Autoregressive Generation with Variational State Space Models
di: Lambrechts, Gaspard, et al.
Pubblicazione: (2024)

Parallelizable memory recurrent units
di: De Geeter, Florent, et al.
Pubblicazione: (2026)

Partial-Label Learning with a Reject Option
di: Fuchs, Tobias, et al.
Pubblicazione: (2024)

Efficient Generation of Hidden Outliers for Improved Outlier Detection
di: Cribeiro-Ramallo, Jose, et al.
Pubblicazione: (2024)

Actor-Critic without Actor
di: Ki, Donghyeon, et al.
Pubblicazione: (2025)

Actor-Critic Reinforcement Learning with Phased Actor
di: Wu, Ruofan, et al.
Pubblicazione: (2024)

D2 Actor Critic: Diffusion Actor Meets Distributional Critic
di: Zhang, Lunjun, et al.
Pubblicazione: (2025)

Actor-Critic or Critic-Actor? A Tale of Two Time Scales
di: Bhatnagar, Shalabh, et al.
Pubblicazione: (2022)

Generative Actor Critic
di: Qin, Aoyang, et al.
Pubblicazione: (2025)

Reinforcement Learning to improve delta robot throws for sorting scrap metal
di: Louette, Arthur, et al.
Pubblicazione: (2024)

Objective-Specific Privileged Bases via Full-Prefix Matryoshka Learning
di: Talukder, Arghamitra, et al.
Pubblicazione: (2026)

Generative Subspace Adversarial Active Learning for Outlier Detection in Multiple Views of High-dimensional Data
di: Cribeiro-Ramallo, Jose, et al.
Pubblicazione: (2024)

Finite-Time Analysis of Three-Timescale Constrained Actor-Critic and Constrained Natural Actor-Critic Algorithms
di: Panda, Prashansa, et al.
Pubblicazione: (2023)

Adaptive Ensemble Aggregation for Actor-Critics
di: Werge, Nicklas, et al.
Pubblicazione: (2025)

Risk-Sensitive Exponential Actor Critic
di: Granados, Alonso, et al.
Pubblicazione: (2026)

Safe Langevin Soft Actor Critic
di: Keswani, Mahesh, et al.
Pubblicazione: (2026)

On the Convergence of Single-Timescale Actor-Critic
di: Kumar, Navdeep, et al.
Pubblicazione: (2024)

Actor-Critic with Active Importance Sampling
di: Molaei, Majid, et al.
Pubblicazione: (2026)

When Learning Rates Go Wrong: Early Structural Signals in PPO Actor-Critic
di: Fernández-Hernández, Alberto, et al.
Pubblicazione: (2026)

Bidirectional Soft Actor-Critic: Leveraging Forward and Reverse KL Divergence for Efficient Reinforcement Learning
di: Zhang, Yixian, et al.
Pubblicazione: (2025)

Maximum Mean Discrepancy on Exponential Windows for Online Change Detection
di: Kalinke, Florian, et al.
Pubblicazione: (2022)

Deep Actor-Critics with Tight Risk Certificates
di: Tasdighi, Bahareh, et al.
Pubblicazione: (2025)

Compatible Gradient Approximations for Actor-Critic Algorithms
di: Saglam, Baturay, et al.
Pubblicazione: (2024)

Refined Analysis of Entropy-Regularized Actor-Critic
di: Labbi, Safwan, et al.
Pubblicazione: (2026)

Actor-Critic Pretraining for Proximal Policy Optimization
di: Kernbach, Andreas, et al.
Pubblicazione: (2026)

PAC-Bayesian Soft Actor-Critic Learning
di: Tasdighi, Bahareh, et al.
Pubblicazione: (2023)

Multi-Agent Actor-Critic with Harmonic Annealing Pruning for Dynamic Spectrum Access Systems
di: Stamatelis, George, et al.
Pubblicazione: (2025)

Privilege Scores
di: Bothmann, Ludwig, et al.
Pubblicazione: (2025)

Adviser-Actor-Critic: Eliminating Steady-State Error in Reinforcement Learning Control
di: Chen, Donghe, et al.
Pubblicazione: (2025)

Average-Reward Soft Actor-Critic
di: Adamczyk, Jacob, et al.
Pubblicazione: (2025)

Wasserstein Barycenter Soft Actor-Critic
di: Shahrooei, Zahra, et al.
Pubblicazione: (2025)

Value Improved Actor Critic Algorithms
di: Oren, Yaniv, et al.
Pubblicazione: (2024)

Diffusion Actor-Critic with Entropy Regulator
di: Wang, Yinuo, et al.
Pubblicazione: (2024)

Revisiting Discrete Soft Actor-Critic
di: Zhou, Haibin, et al.
Pubblicazione: (2022)

Generalizability of experimental studies
di: Matteucci, Federico, et al.
Pubblicazione: (2024)