Salvato in:
| Autore principale: | Pastukhov, Sergey |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2024
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2404.16072 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
Solving Sokoban using Hierarchical Reinforcement Learning with Landmarks
di: Pastukhov, Sergey
Pubblicazione: (2025)
di: Pastukhov, Sergey
Pubblicazione: (2025)
Read to Play (R2-Play): Decision Transformer with Multimodal Game Instruction
di: Jin, Yonggang, et al.
Pubblicazione: (2024)
di: Jin, Yonggang, et al.
Pubblicazione: (2024)
Learning Game-Playing Agents with Generative Code Optimization
di: Kuang, Zhiyi, et al.
Pubblicazione: (2025)
di: Kuang, Zhiyi, et al.
Pubblicazione: (2025)
Bridging Local and Global Knowledge via Transformer in Board Games
di: Ju, Yan-Ru, et al.
Pubblicazione: (2024)
di: Ju, Yan-Ru, et al.
Pubblicazione: (2024)
A Novel Approach to Solving Goal-Achieving Problems for Board Games
di: Shih, Chung-Chin, et al.
Pubblicazione: (2021)
di: Shih, Chung-Chin, et al.
Pubblicazione: (2021)
Learning to play: A Multimodal Agent for 3D Game-Play
di: Yue, Yuguang, et al.
Pubblicazione: (2025)
di: Yue, Yuguang, et al.
Pubblicazione: (2025)
AXIOM: Learning to Play Games in Minutes with Expanding Object-Centric Models
di: Heins, Conor, et al.
Pubblicazione: (2025)
di: Heins, Conor, et al.
Pubblicazione: (2025)
BeamVQ: Beam Search with Vector Quantization to Mitigate Data Scarcity in Physical Spatiotemporal Forecasting
di: Wang, Weiyan, et al.
Pubblicazione: (2025)
di: Wang, Weiyan, et al.
Pubblicazione: (2025)
Optimising Random Forest Machine Learning Algorithms for User VR Experience Prediction Based on Iterative Local Search-Sparrow Search Algorithm
di: Tang, Xirui, et al.
Pubblicazione: (2024)
di: Tang, Xirui, et al.
Pubblicazione: (2024)
Learning To Play Atari Games Using Dueling Q-Learning and Hebbian Plasticity
di: Salehin, Md Ashfaq
Pubblicazione: (2024)
di: Salehin, Md Ashfaq
Pubblicazione: (2024)
Mastering Board Games by External and Internal Planning with Language Models
di: Schultz, John, et al.
Pubblicazione: (2024)
di: Schultz, John, et al.
Pubblicazione: (2024)
Enhancing Reinforcement Learning for the Floorplanning of Analog ICs with Beam Search
di: Della Rovere, Sandro Junior, et al.
Pubblicazione: (2025)
di: Della Rovere, Sandro Junior, et al.
Pubblicazione: (2025)
Beam Prediction based on Large Language Models
di: Sheng, Yucheng, et al.
Pubblicazione: (2024)
di: Sheng, Yucheng, et al.
Pubblicazione: (2024)
Language Agents with Reinforcement Learning for Strategic Play in the Werewolf Game
di: Xu, Zelai, et al.
Pubblicazione: (2023)
di: Xu, Zelai, et al.
Pubblicazione: (2023)
Neural Beam Field for Spatial Beam RSRP Prediction
di: Guo, Keqiang, et al.
Pubblicazione: (2025)
di: Guo, Keqiang, et al.
Pubblicazione: (2025)
Affective and Dynamic Beam Search for Story Generation
di: Huang, Tenghao, et al.
Pubblicazione: (2023)
di: Huang, Tenghao, et al.
Pubblicazione: (2023)
Superhuman AI for Stratego Using Self-Play Reinforcement Learning and Test-Time Search
di: Sokota, Samuel, et al.
Pubblicazione: (2025)
di: Sokota, Samuel, et al.
Pubblicazione: (2025)
Monte Carlo Beam Search for Actor-Critic Reinforcement Learning in Continuous Control
di: Alzorgan, Hazim, et al.
Pubblicazione: (2025)
di: Alzorgan, Hazim, et al.
Pubblicazione: (2025)
CognitionNet: A Collaborative Neural Network for Play Style Discovery in Online Skill Gaming Platform
di: Talwadker, Rukma, et al.
Pubblicazione: (2025)
di: Talwadker, Rukma, et al.
Pubblicazione: (2025)
Measuring Progress in Dictionary Learning for Language Model Interpretability with Board Game Models
di: Karvonen, Adam, et al.
Pubblicazione: (2024)
di: Karvonen, Adam, et al.
Pubblicazione: (2024)
TextAtari: 100K Frames Game Playing with Language Agents
di: Li, Wenhao, et al.
Pubblicazione: (2025)
di: Li, Wenhao, et al.
Pubblicazione: (2025)
PredictaBoard: Benchmarking LLM Score Predictability
di: Pacchiardi, Lorenzo, et al.
Pubblicazione: (2025)
di: Pacchiardi, Lorenzo, et al.
Pubblicazione: (2025)
ABS: Enforcing Constraint Satisfaction On Generated Sequences Via Automata-Guided Beam Search
di: Collura, Vincenzo, et al.
Pubblicazione: (2025)
di: Collura, Vincenzo, et al.
Pubblicazione: (2025)
More Test-Time Compute Can Hurt: Overestimation Bias in LLM Beam Search
di: Dalal, Gal, et al.
Pubblicazione: (2026)
di: Dalal, Gal, et al.
Pubblicazione: (2026)
SPC: Evolving Self-Play Critic via Adversarial Games for LLM Reasoning
di: Chen, Jiaqi, et al.
Pubblicazione: (2025)
di: Chen, Jiaqi, et al.
Pubblicazione: (2025)
Learning to Play Video Games with Intuitive Physics Priors
di: Jaiswal, Abhishek, et al.
Pubblicazione: (2024)
di: Jaiswal, Abhishek, et al.
Pubblicazione: (2024)
Best Agent Identification for General Game Playing
di: Stephenson, Matthew, et al.
Pubblicazione: (2025)
di: Stephenson, Matthew, et al.
Pubblicazione: (2025)
VolleyBots: A Testbed for Multi-Drone Volleyball Game Combining Motion Control and Strategic Play
di: Xu, Zelai, et al.
Pubblicazione: (2025)
di: Xu, Zelai, et al.
Pubblicazione: (2025)
Playing DOOM with 1.3M Parameters: Specialized Small Models vs Large Language Models for Real-Time Game Control
di: Golchinfar, David, et al.
Pubblicazione: (2026)
di: Golchinfar, David, et al.
Pubblicazione: (2026)
Offline Fictitious Self-Play for Competitive Games
di: Chen, Jingxiao, et al.
Pubblicazione: (2024)
di: Chen, Jingxiao, et al.
Pubblicazione: (2024)
Prediction-Intervention Games and Invariant Sets
di: Kühne, Linus, et al.
Pubblicazione: (2026)
di: Kühne, Linus, et al.
Pubblicazione: (2026)
Improving GFlowNets with Monte Carlo Tree Search
di: Morozov, Nikita, et al.
Pubblicazione: (2024)
di: Morozov, Nikita, et al.
Pubblicazione: (2024)
Play Style Identification Using Low-Level Representations of Play Traces in MicroRTS
di: Xia, Ruizhe Yu, et al.
Pubblicazione: (2025)
di: Xia, Ruizhe Yu, et al.
Pubblicazione: (2025)
BEAR: Towards Beam-Search-Aware Optimization for Recommendation with Large Language Models
di: Yang, Weiqin, et al.
Pubblicazione: (2026)
di: Yang, Weiqin, et al.
Pubblicazione: (2026)
Can Large Language Models Play Text Games Well? Current State-of-the-Art and Open Questions
di: Tsai, Chen Feng, et al.
Pubblicazione: (2023)
di: Tsai, Chen Feng, et al.
Pubblicazione: (2023)
TriPlay-RL: Tri-Role Self-Play Reinforcement Learning for LLM Safety Alignment
di: Tan, Zhewen, et al.
Pubblicazione: (2026)
di: Tan, Zhewen, et al.
Pubblicazione: (2026)
Digital Twin-Assisted Explainable AI for Robust Beam Prediction in mmWave MIMO Systems
di: Khan, Nasir, et al.
Pubblicazione: (2025)
di: Khan, Nasir, et al.
Pubblicazione: (2025)
Back to the Drawing Board for Fair Representation Learning
di: Pouget, Angéline, et al.
Pubblicazione: (2024)
di: Pouget, Angéline, et al.
Pubblicazione: (2024)
Data-Augmented Game Starts for Accelerating Self-Play Exploration in Imperfect Information Games
di: Lanier, JB, et al.
Pubblicazione: (2026)
di: Lanier, JB, et al.
Pubblicazione: (2026)
Aggregating Concepts of Fairness and Accuracy in Prediction Algorithms
di: Kinney, David
Pubblicazione: (2025)
di: Kinney, David
Pubblicazione: (2025)
Documenti analoghi
-
Solving Sokoban using Hierarchical Reinforcement Learning with Landmarks
di: Pastukhov, Sergey
Pubblicazione: (2025) -
Read to Play (R2-Play): Decision Transformer with Multimodal Game Instruction
di: Jin, Yonggang, et al.
Pubblicazione: (2024) -
Learning Game-Playing Agents with Generative Code Optimization
di: Kuang, Zhiyi, et al.
Pubblicazione: (2025) -
Bridging Local and Global Knowledge via Transformer in Board Games
di: Ju, Yan-Ru, et al.
Pubblicazione: (2024) -
A Novel Approach to Solving Goal-Achieving Problems for Board Games
di: Shih, Chung-Chin, et al.
Pubblicazione: (2021)