:: Library Catalog

Imagen de Portada

Guardado en:

Detalles Bibliográficos
Autor principal:	Kuznetsov, Igor
Formato:	Preprint
Publicado:	2022
Materias:	Machine Learning Artificial Intelligence
Acceso en línea:	https://arxiv.org/abs/2206.12674
Etiquetas:	Agregar Etiqueta Sin Etiquetas, Sea el primero en etiquetar este registro!

Ejemplares similares

Monte Carlo Beam Search for Actor-Critic Reinforcement Learning in Continuous Control
por: Alzorgan, Hazim, et al.
Publicado: (2025)

Reinforcement Learning by Guided Safe Exploration
por: Yang, Qisong, et al.
Publicado: (2023)

Monte Carlo Tree Search with Boltzmann Exploration
por: Painter, Michael, et al.
Publicado: (2024)

Is Exploration or Optimization the Problem for Deep Reinforcement Learning?
por: Berseth, Glen
Publicado: (2025)

Guiding Exploration in Reinforcement Learning Through LLM-Augmented Observations
por: Jain, Vaibhav, et al.
Publicado: (2025)

Can LLMs Guide Their Own Exploration? Gradient-Guided Reinforcement Learning for LLM Reasoning
por: Liang, Zhenwen, et al.
Publicado: (2025)

Bayes Adaptive Monte Carlo Tree Search for Offline Model-based Reinforcement Learning
por: Chen, Jiayu, et al.
Publicado: (2024)

Sampling for Quality: Training-Free Reward-Guided LLM Decoding via Sequential Monte Carlo
por: Markovic-Voronov, Jelena, et al.
Publicado: (2026)

SIGMA: Refining Large Language Model Reasoning via Sibling-Guided Monte Carlo Augmentation
por: Ren, Yanwei, et al.
Publicado: (2025)

Sequential Monte Carlo for Policy Optimization in Continuous POMDPs
por: Abdulsamad, Hany, et al.
Publicado: (2025)

Emergence of Exploration in Policy Gradient Reinforcement Learning via Retrying
por: Nishimori, Soichiro, et al.
Publicado: (2026)

Monte Carlo Tree Search Boosts Reasoning via Iterative Preference Learning
por: Xie, Yuxi, et al.
Publicado: (2024)

Tree-OPO: Off-policy Monte Carlo Tree-Guided Advantage Optimization for Multistep Reasoning
por: Huang, Bingning, et al.
Publicado: (2025)

In-context Exploration-Exploitation for Reinforcement Learning
por: Dai, Zhenwen, et al.
Publicado: (2024)

Satisficing Exploration for Deep Reinforcement Learning
por: Arumugam, Dilip, et al.
Publicado: (2024)

Learning Solution Operators for Partial Differential Equations via Monte Carlo-Type Approximation
por: Choutri, Salah Eddine, et al.
Publicado: (2025)

Contraction Actor-Critic: Contraction Metric-Guided Reinforcement Learning for Robust Path Tracking
por: Cho, Minjae, et al.
Publicado: (2025)

OPRIDE: Offline Preference-based Reinforcement Learning via In-Dataset Exploration
por: Yang, Yiqin, et al.
Publicado: (2026)

More Efficient Randomized Exploration for Reinforcement Learning via Approximate Sampling
por: Ishfaq, Haque, et al.
Publicado: (2024)

Efficient On-Policy Reinforcement Learning via Exploration of Sparse Parameter Space
por: Zhang, Xinyu, et al.
Publicado: (2025)

Analytic Energy-Guided Policy Optimization for Offline Reinforcement Learning
por: Hu, Jifeng, et al.
Publicado: (2025)

UNSAT Solver Synthesis via Monte Carlo Forest Search
por: Cameron, Chris, et al.
Publicado: (2022)

Deep Reinforcement Learning Xiangqi Player with Monte Carlo Tree Search
por: Yilmaz, Berk, et al.
Publicado: (2025)

Monte Carlo Permutation Search
por: Cazenave, Tristan
Publicado: (2025)

Optimizing Tensor Computation Graphs with Equality Saturation and Monte Carlo Tree Search
por: Hartmann, Jakob, et al.
Publicado: (2024)

Monte Carlo Tree Search based Space Transfer for Black-box Optimization
por: Wang, Shukuan, et al.
Publicado: (2024)

Guided Exploration for Efficient Relational Model Learning
por: Feng, Annie, et al.
Publicado: (2025)

Goal Exploration via Adaptive Skill Distribution for Goal-Conditioned Reinforcement Learning
por: Wu, Lisheng, et al.
Publicado: (2024)

EFRame: Deeper Reasoning via Exploration-Filter-Replay Reinforcement Learning Framework
por: Wang, Chen, et al.
Publicado: (2025)

Neighboring State-based Exploration for Reinforcement Learning
por: Li, Yu-Teng, et al.
Publicado: (2022)

Variable-Agnostic Causal Exploration for Reinforcement Learning
por: Nguyen, Minh Hoang, et al.
Publicado: (2024)

Exploration in Knowledge Transfer Utilizing Reinforcement Learning
por: Jedlička, Adam, et al.
Publicado: (2024)

POLO: Preference-Guided Multi-Turn Reinforcement Learning for Lead Optimization
por: Wang, Ziqing, et al.
Publicado: (2025)

Is Exploration All You Need? Effective Exploration Characteristics for Transfer in Reinforcement Learning
por: Balloch, Jonathan C., et al.
Publicado: (2024)

R$^3$L: Reflect-then-Retry Reinforcement Learning with Language-Guided Exploration, Pivotal Credit, and Positive Amplification
por: Shi, Weijie, et al.
Publicado: (2026)

Epistemic Monte Carlo Tree Search
por: Oren, Yaniv, et al.
Publicado: (2022)

Robust Exploration in Directed Controller Synthesis via Reinforcement Learning with Soft Mixture-of-Experts
por: Ubukata, Toshihide, et al.
Publicado: (2026)

Enhance Exploration in Safe Reinforcement Learning with Contrastive Representation Learning
por: Doan, Duc Kien, et al.
Publicado: (2025)

Unlocking Reasoning Capabilities in LLMs via Reinforcement Learning Exploration
por: Deng, Wenhao, et al.
Publicado: (2025)

TGPO: Tree-Guided Preference Optimization for Robust Web Agent Reinforcement Learning
por: Chen, Ziyuan, et al.
Publicado: (2025)