Salvato in:
| Autori principali: | Jin, Xuanfa, Wang, Ziyan, Du, Yali, Fang, Meng, Zhang, Haifeng, Wang, Jun |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2024
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2405.19946 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
VAM: Verbalized Action Masking for Controllable Exploration in RL Post-Training -- A Chess Case Study
di: Zhang, Zhicheng, et al.
Pubblicazione: (2026)
di: Zhang, Zhicheng, et al.
Pubblicazione: (2026)
Language Agents with Reinforcement Learning for Strategic Play in the Werewolf Game
di: Xu, Zelai, et al.
Pubblicazione: (2023)
di: Xu, Zelai, et al.
Pubblicazione: (2023)
M3HF: Multi-agent Reinforcement Learning from Multi-phase Human Feedback of Mixed Quality
di: Wang, Ziyan, et al.
Pubblicazione: (2025)
di: Wang, Ziyan, et al.
Pubblicazione: (2025)
Learning Strategic Language Agents in the Werewolf Game with Iterative Latent Space Policy Optimization
di: Xu, Zelai, et al.
Pubblicazione: (2025)
di: Xu, Zelai, et al.
Pubblicazione: (2025)
Sim2Sea: Sim-to-Real Policy Transfer for Maritime Vessel Navigation in Congested Waters
di: Cui, Xinyu, et al.
Pubblicazione: (2026)
di: Cui, Xinyu, et al.
Pubblicazione: (2026)
Verbal Werewolf: Engage Users with Verbalized Agentic Werewolf Game Framework
di: Fan, Qihui, et al.
Pubblicazione: (2025)
di: Fan, Qihui, et al.
Pubblicazione: (2025)
Werewolf Arena: A Case Study in LLM Evaluation via Social Deduction
di: Bailis, Suma, et al.
Pubblicazione: (2024)
di: Bailis, Suma, et al.
Pubblicazione: (2024)
MultiMind: Enhancing Werewolf Agents with Multimodal Reasoning and Theory of Mind
di: Zhang, Zheng, et al.
Pubblicazione: (2025)
di: Zhang, Zheng, et al.
Pubblicazione: (2025)
Helmsman of the Masses? Evaluate the Opinion Leadership of Large Language Models in the Werewolf Game
di: Du, Silin, et al.
Pubblicazione: (2024)
di: Du, Silin, et al.
Pubblicazione: (2024)
Natural Language Reinforcement Learning
di: Feng, Xidong, et al.
Pubblicazione: (2024)
di: Feng, Xidong, et al.
Pubblicazione: (2024)
Enhance Reasoning for Large Language Models in the Game Werewolf
di: Wu, Shuang, et al.
Pubblicazione: (2024)
di: Wu, Shuang, et al.
Pubblicazione: (2024)
WOLF: Werewolf-based Observations for LLM Deception and Falsehoods
di: Agarwal, Mrinal, et al.
Pubblicazione: (2025)
di: Agarwal, Mrinal, et al.
Pubblicazione: (2025)
CASCADE: Case-Based Continual Adaptation for Large Language Models During Deployment
di: Guo, Siyuan, et al.
Pubblicazione: (2026)
di: Guo, Siyuan, et al.
Pubblicazione: (2026)
Is Monitoring Enough? Strategic Agent Selection For Stealthy Attack in Multi-Agent Discussions
di: Xiang, Qiuchi, et al.
Pubblicazione: (2026)
di: Xiang, Qiuchi, et al.
Pubblicazione: (2026)
MEAL: A Benchmark for Continual Multi-Agent Reinforcement Learning
di: Tomilin, Tristan, et al.
Pubblicazione: (2025)
di: Tomilin, Tristan, et al.
Pubblicazione: (2025)
Spiral of Silence in Large Language Model Agents
di: Zhong, Mingze, et al.
Pubblicazione: (2025)
di: Zhong, Mingze, et al.
Pubblicazione: (2025)
WereWolf-Plus: An Update of Werewolf Game setting Based on DSGBench
di: Xia, Xinyuan, et al.
Pubblicazione: (2025)
di: Xia, Xinyuan, et al.
Pubblicazione: (2025)
Enhancing Consistency of Werewolf AI through Dialogue Summarization and Persona Information
di: Tanaka, Yoshiki, et al.
Pubblicazione: (2026)
di: Tanaka, Yoshiki, et al.
Pubblicazione: (2026)
ATLaS: Agent Tuning via Learning Critical Steps
di: Chen, Zhixun, et al.
Pubblicazione: (2025)
di: Chen, Zhixun, et al.
Pubblicazione: (2025)
Distill Not Only Data but Also Rewards: Can Smaller Language Models Surpass Larger Ones?
di: Zhang, Yudi, et al.
Pubblicazione: (2025)
di: Zhang, Yudi, et al.
Pubblicazione: (2025)
Invariant Learning via Probability of Sufficient and Necessary Causes
di: Yang, Mengyue, et al.
Pubblicazione: (2023)
di: Yang, Mengyue, et al.
Pubblicazione: (2023)
Enhancing Dialogue Generation in Werewolf Game Through Situation Analysis and Persuasion Strategies
di: Qi, Zhiyang, et al.
Pubblicazione: (2024)
di: Qi, Zhiyang, et al.
Pubblicazione: (2024)
A Review of Safe Reinforcement Learning: Methods, Theory and Applications
di: Gu, Shangding, et al.
Pubblicazione: (2022)
di: Gu, Shangding, et al.
Pubblicazione: (2022)
STAS: Spatial-Temporal Return Decomposition for Multi-agent Reinforcement Learning
di: Chen, Sirui, et al.
Pubblicazione: (2023)
di: Chen, Sirui, et al.
Pubblicazione: (2023)
PillagerBench: Benchmarking LLM-Based Agents in Competitive Minecraft Team Environments
di: Schipper, Olivier, et al.
Pubblicazione: (2025)
di: Schipper, Olivier, et al.
Pubblicazione: (2025)
Agent-Based Simulations of Online Political Discussions: A Case Study on Elections in Germany
di: Sittar, Abdul, et al.
Pubblicazione: (2025)
di: Sittar, Abdul, et al.
Pubblicazione: (2025)
Skill-Pro: Learning Reusable Skills from Experience via Non-Parametric PPO for LLM Agents
di: Mi, Qirui, et al.
Pubblicazione: (2026)
di: Mi, Qirui, et al.
Pubblicazione: (2026)
A Joint Learning Model with Variational Interaction for Multilingual Program Translation
di: Du, Yali, et al.
Pubblicazione: (2024)
di: Du, Yali, et al.
Pubblicazione: (2024)
Cooperative Open-ended Learning Framework for Zero-shot Coordination
di: Li, Yang, et al.
Pubblicazione: (2023)
di: Li, Yang, et al.
Pubblicazione: (2023)
Re2LLM: Reflective Reinforcement Large Language Model for Session-based Recommendation
di: Wang, Ziyan, et al.
Pubblicazione: (2024)
di: Wang, Ziyan, et al.
Pubblicazione: (2024)
An Empirical Study of OpenAI API Discussions on Stack Overflow
di: Chen, Xiang, et al.
Pubblicazione: (2025)
di: Chen, Xiang, et al.
Pubblicazione: (2025)
PBADet: A One-Stage Anchor-Free Approach for Part-Body Association
di: Gao, Zhongpai, et al.
Pubblicazione: (2024)
di: Gao, Zhongpai, et al.
Pubblicazione: (2024)
Safe Multi-agent Reinforcement Learning with Natural Language Constraints
di: Wang, Ziyan, et al.
Pubblicazione: (2024)
di: Wang, Ziyan, et al.
Pubblicazione: (2024)
A Comprehensive Survey on Process-Oriented Automatic Text Summarization with Exploration of LLM-Based Methods
di: Zhang, Yang, et al.
Pubblicazione: (2024)
di: Zhang, Yang, et al.
Pubblicazione: (2024)
EgoNight: Towards Egocentric Vision Understanding at Night with a Challenging Benchmark
di: Zhang, Deheng, et al.
Pubblicazione: (2025)
di: Zhang, Deheng, et al.
Pubblicazione: (2025)
MACCA: Offline Multi-agent Reinforcement Learning with Causal Credit Assignment
di: Wang, Ziyan, et al.
Pubblicazione: (2023)
di: Wang, Ziyan, et al.
Pubblicazione: (2023)
DeepContour: A Hybrid Deep Learning Framework for Accelerating Generalized Eigenvalue Problem Solving via Efficient Contour Design
di: Chen, Yeqiu, et al.
Pubblicazione: (2025)
di: Chen, Yeqiu, et al.
Pubblicazione: (2025)
RuAG: Learned-rule-augmented Generation for Large Language Models
di: Zhang, Yudi, et al.
Pubblicazione: (2024)
di: Zhang, Yudi, et al.
Pubblicazione: (2024)
Post-Incorporating Code Structural Knowledge into Pretrained Models via ICL for Code Translation
di: Du, Yali, et al.
Pubblicazione: (2025)
di: Du, Yali, et al.
Pubblicazione: (2025)
A Comparative User Evaluation of XRL Explanations using Goal Identification
di: Towers, Mark, et al.
Pubblicazione: (2025)
di: Towers, Mark, et al.
Pubblicazione: (2025)
Documenti analoghi
-
VAM: Verbalized Action Masking for Controllable Exploration in RL Post-Training -- A Chess Case Study
di: Zhang, Zhicheng, et al.
Pubblicazione: (2026) -
Language Agents with Reinforcement Learning for Strategic Play in the Werewolf Game
di: Xu, Zelai, et al.
Pubblicazione: (2023) -
M3HF: Multi-agent Reinforcement Learning from Multi-phase Human Feedback of Mixed Quality
di: Wang, Ziyan, et al.
Pubblicazione: (2025) -
Learning Strategic Language Agents in the Werewolf Game with Iterative Latent Space Policy Optimization
di: Xu, Zelai, et al.
Pubblicazione: (2025) -
Sim2Sea: Sim-to-Real Policy Transfer for Maritime Vessel Navigation in Congested Waters
di: Cui, Xinyu, et al.
Pubblicazione: (2026)