:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autori principali:	Jin, Xuanfa, Wang, Ziyan, Du, Yali, Fang, Meng, Zhang, Haifeng, Wang, Jun
Natura:	Preprint
Pubblicazione:	2024
Soggetti:	Artificial Intelligence
Accesso online:	https://arxiv.org/abs/2405.19946
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

VAM: Verbalized Action Masking for Controllable Exploration in RL Post-Training -- A Chess Case Study
di: Zhang, Zhicheng, et al.
Pubblicazione: (2026)

Language Agents with Reinforcement Learning for Strategic Play in the Werewolf Game
di: Xu, Zelai, et al.
Pubblicazione: (2023)

M3HF: Multi-agent Reinforcement Learning from Multi-phase Human Feedback of Mixed Quality
di: Wang, Ziyan, et al.
Pubblicazione: (2025)

Learning Strategic Language Agents in the Werewolf Game with Iterative Latent Space Policy Optimization
di: Xu, Zelai, et al.
Pubblicazione: (2025)

Sim2Sea: Sim-to-Real Policy Transfer for Maritime Vessel Navigation in Congested Waters
di: Cui, Xinyu, et al.
Pubblicazione: (2026)

Verbal Werewolf: Engage Users with Verbalized Agentic Werewolf Game Framework
di: Fan, Qihui, et al.
Pubblicazione: (2025)

Werewolf Arena: A Case Study in LLM Evaluation via Social Deduction
di: Bailis, Suma, et al.
Pubblicazione: (2024)

MultiMind: Enhancing Werewolf Agents with Multimodal Reasoning and Theory of Mind
di: Zhang, Zheng, et al.
Pubblicazione: (2025)

Helmsman of the Masses? Evaluate the Opinion Leadership of Large Language Models in the Werewolf Game
di: Du, Silin, et al.
Pubblicazione: (2024)

Natural Language Reinforcement Learning
di: Feng, Xidong, et al.
Pubblicazione: (2024)

Enhance Reasoning for Large Language Models in the Game Werewolf
di: Wu, Shuang, et al.
Pubblicazione: (2024)

WOLF: Werewolf-based Observations for LLM Deception and Falsehoods
di: Agarwal, Mrinal, et al.
Pubblicazione: (2025)

CASCADE: Case-Based Continual Adaptation for Large Language Models During Deployment
di: Guo, Siyuan, et al.
Pubblicazione: (2026)

Is Monitoring Enough? Strategic Agent Selection For Stealthy Attack in Multi-Agent Discussions
di: Xiang, Qiuchi, et al.
Pubblicazione: (2026)

MEAL: A Benchmark for Continual Multi-Agent Reinforcement Learning
di: Tomilin, Tristan, et al.
Pubblicazione: (2025)

Spiral of Silence in Large Language Model Agents
di: Zhong, Mingze, et al.
Pubblicazione: (2025)

WereWolf-Plus: An Update of Werewolf Game setting Based on DSGBench
di: Xia, Xinyuan, et al.
Pubblicazione: (2025)

Enhancing Consistency of Werewolf AI through Dialogue Summarization and Persona Information
di: Tanaka, Yoshiki, et al.
Pubblicazione: (2026)

ATLaS: Agent Tuning via Learning Critical Steps
di: Chen, Zhixun, et al.
Pubblicazione: (2025)

Distill Not Only Data but Also Rewards: Can Smaller Language Models Surpass Larger Ones?
di: Zhang, Yudi, et al.
Pubblicazione: (2025)

Invariant Learning via Probability of Sufficient and Necessary Causes
di: Yang, Mengyue, et al.
Pubblicazione: (2023)

Enhancing Dialogue Generation in Werewolf Game Through Situation Analysis and Persuasion Strategies
di: Qi, Zhiyang, et al.
Pubblicazione: (2024)

A Review of Safe Reinforcement Learning: Methods, Theory and Applications
di: Gu, Shangding, et al.
Pubblicazione: (2022)

STAS: Spatial-Temporal Return Decomposition for Multi-agent Reinforcement Learning
di: Chen, Sirui, et al.
Pubblicazione: (2023)

PillagerBench: Benchmarking LLM-Based Agents in Competitive Minecraft Team Environments
di: Schipper, Olivier, et al.
Pubblicazione: (2025)

Agent-Based Simulations of Online Political Discussions: A Case Study on Elections in Germany
di: Sittar, Abdul, et al.
Pubblicazione: (2025)

Skill-Pro: Learning Reusable Skills from Experience via Non-Parametric PPO for LLM Agents
di: Mi, Qirui, et al.
Pubblicazione: (2026)

A Joint Learning Model with Variational Interaction for Multilingual Program Translation
di: Du, Yali, et al.
Pubblicazione: (2024)

Cooperative Open-ended Learning Framework for Zero-shot Coordination
di: Li, Yang, et al.
Pubblicazione: (2023)

Re2LLM: Reflective Reinforcement Large Language Model for Session-based Recommendation
di: Wang, Ziyan, et al.
Pubblicazione: (2024)

An Empirical Study of OpenAI API Discussions on Stack Overflow
di: Chen, Xiang, et al.
Pubblicazione: (2025)

PBADet: A One-Stage Anchor-Free Approach for Part-Body Association
di: Gao, Zhongpai, et al.
Pubblicazione: (2024)

Safe Multi-agent Reinforcement Learning with Natural Language Constraints
di: Wang, Ziyan, et al.
Pubblicazione: (2024)

A Comprehensive Survey on Process-Oriented Automatic Text Summarization with Exploration of LLM-Based Methods
di: Zhang, Yang, et al.
Pubblicazione: (2024)

EgoNight: Towards Egocentric Vision Understanding at Night with a Challenging Benchmark
di: Zhang, Deheng, et al.
Pubblicazione: (2025)

MACCA: Offline Multi-agent Reinforcement Learning with Causal Credit Assignment
di: Wang, Ziyan, et al.
Pubblicazione: (2023)

DeepContour: A Hybrid Deep Learning Framework for Accelerating Generalized Eigenvalue Problem Solving via Efficient Contour Design
di: Chen, Yeqiu, et al.
Pubblicazione: (2025)

RuAG: Learned-rule-augmented Generation for Large Language Models
di: Zhang, Yudi, et al.
Pubblicazione: (2024)

Post-Incorporating Code Structural Knowledge into Pretrained Models via ICL for Code Translation
di: Du, Yali, et al.
Pubblicazione: (2025)

A Comparative User Evaluation of XRL Explanations using Goal Identification
di: Towers, Mark, et al.
Pubblicazione: (2025)