Gespeichert in:
| Hauptverfasser: | Wang, Haonan, Zhao, Mingjia, Sun, Junfeng, Liu, Wei |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2025
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2509.03479 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
Research on the Integration of Embodied Intelligence and Reinforcement Learning in Textual Domains
von: Wang, Haonan, et al.
Veröffentlicht: (2025)
von: Wang, Haonan, et al.
Veröffentlicht: (2025)
ByteSized32Refactored: Towards an Extensible Interactive Text Games Corpus for LLM World Modeling and Evaluation
von: Wang, Haonan, et al.
Veröffentlicht: (2025)
von: Wang, Haonan, et al.
Veröffentlicht: (2025)
Research on geometric figure classification algorithm based on Deep Learning
von: Wang, Ruiyang, et al.
Veröffentlicht: (2024)
von: Wang, Ruiyang, et al.
Veröffentlicht: (2024)
Learning to Rewrite: Generalized LLM-Generated Text Detection
von: Li, Ran, et al.
Veröffentlicht: (2024)
von: Li, Ran, et al.
Veröffentlicht: (2024)
Playing 20 Question Game with Policy-Based Reinforcement Learning
von: Hu, Huang, et al.
Veröffentlicht: (2018)
von: Hu, Huang, et al.
Veröffentlicht: (2018)
Monte Carlo Planning with Large Language Model for Text-Based Game Agents
von: Shi, Zijing, et al.
Veröffentlicht: (2025)
von: Shi, Zijing, et al.
Veröffentlicht: (2025)
TextGames: Learning to Self-Play Text-Based Puzzle Games via Language Model Reasoning
von: Hudi, Frederikus, et al.
Veröffentlicht: (2025)
von: Hudi, Frederikus, et al.
Veröffentlicht: (2025)
Persona Dynamics: Unveiling the Impact of Personality Traits on Agents in Text-Based Games
von: Lim, Seungwon, et al.
Veröffentlicht: (2025)
von: Lim, Seungwon, et al.
Veröffentlicht: (2025)
GAP: Graph-Based Agent Planning with Parallel Tool Use and Reinforcement Learning
von: Wu, Jiaqi, et al.
Veröffentlicht: (2025)
von: Wu, Jiaqi, et al.
Veröffentlicht: (2025)
DynaWeb: Model-Based Reinforcement Learning of Web Agents
von: Ding, Hang, et al.
Veröffentlicht: (2026)
von: Ding, Hang, et al.
Veröffentlicht: (2026)
A Text-to-Game Engine for UGC-Based Role-Playing Games
von: Zhang, Lei, et al.
Veröffentlicht: (2024)
von: Zhang, Lei, et al.
Veröffentlicht: (2024)
Looking Beyond Text: Reducing Language bias in Large Vision-Language Models via Multimodal Dual-Attention and Soft-Image Guidance
von: Zhao, Haozhe, et al.
Veröffentlicht: (2024)
von: Zhao, Haozhe, et al.
Veröffentlicht: (2024)
Reinforcing Code Generation: Improving Text-to-SQL with Execution-Based Learning
von: Kulkarni, Atharv, et al.
Veröffentlicht: (2025)
von: Kulkarni, Atharv, et al.
Veröffentlicht: (2025)
On the Effects of Fine-tuning Language Models for Text-Based Reinforcement Learning
von: Gruppi, Mauricio, et al.
Veröffentlicht: (2024)
von: Gruppi, Mauricio, et al.
Veröffentlicht: (2024)
EVA: Efficient Reinforcement Learning for End-to-End Video Agent
von: Zhang, Yaolun, et al.
Veröffentlicht: (2026)
von: Zhang, Yaolun, et al.
Veröffentlicht: (2026)
TextQuests: How Good are LLMs at Text-Based Video Games?
von: Phan, Long, et al.
Veröffentlicht: (2025)
von: Phan, Long, et al.
Veröffentlicht: (2025)
Dynamic Optimizations of LLM Ensembles with Two-Stage Reinforcement Learning Agents
von: Tekin, Selim Furkan, et al.
Veröffentlicht: (2025)
von: Tekin, Selim Furkan, et al.
Veröffentlicht: (2025)
Balancing Rewards in Text Summarization: Multi-Objective Reinforcement Learning via HyperVolume Optimization
von: Song, Junjie, et al.
Veröffentlicht: (2025)
von: Song, Junjie, et al.
Veröffentlicht: (2025)
Well Begun, Half Done: Reinforcement Learning with Prefix Optimization for LLM Reasoning
von: Sun, Yiliu, et al.
Veröffentlicht: (2025)
von: Sun, Yiliu, et al.
Veröffentlicht: (2025)
EPO: Entropy-regularized Policy Optimization for LLM Agents Reinforcement Learning
von: Xu, Wujiang, et al.
Veröffentlicht: (2025)
von: Xu, Wujiang, et al.
Veröffentlicht: (2025)
MHPO: Modulated Hazard-aware Policy Optimization for Stable Reinforcement Learning
von: Wang, Hongjun, et al.
Veröffentlicht: (2026)
von: Wang, Hongjun, et al.
Veröffentlicht: (2026)
Optima: Optimizing Effectiveness and Efficiency for LLM-Based Multi-Agent System
von: Chen, Weize, et al.
Veröffentlicht: (2024)
von: Chen, Weize, et al.
Veröffentlicht: (2024)
GAPD: Gold-Action Policy Distillation for Agentic Reinforcement Learning in Knowledge Base Question Answering
von: Sun, Xin, et al.
Veröffentlicht: (2026)
von: Sun, Xin, et al.
Veröffentlicht: (2026)
Reinforcement Learning for Compositional Generalization with Outcome-Level Optimization
von: Fu, Xiyan, et al.
Veröffentlicht: (2026)
von: Fu, Xiyan, et al.
Veröffentlicht: (2026)
AgentGL: Towards Agentic Graph Learning with LLMs via Reinforcement Learning
von: Sun, Yuanfu, et al.
Veröffentlicht: (2026)
von: Sun, Yuanfu, et al.
Veröffentlicht: (2026)
Commonsense Knowledge Editing Based on Free-Text in LLMs
von: Huang, Xiusheng, et al.
Veröffentlicht: (2024)
von: Huang, Xiusheng, et al.
Veröffentlicht: (2024)
Beyond the Turn-Based Game: Enabling Real-Time Conversations with Duplex Models
von: Zhang, Xinrong, et al.
Veröffentlicht: (2024)
von: Zhang, Xinrong, et al.
Veröffentlicht: (2024)
Monocle: Hybrid Local-Global In-Context Evaluation for Long-Text Generation with Uncertainty-Based Active Learning
von: Wang, Xiaorong, et al.
Veröffentlicht: (2025)
von: Wang, Xiaorong, et al.
Veröffentlicht: (2025)
TextAtari: 100K Frames Game Playing with Language Agents
von: Li, Wenhao, et al.
Veröffentlicht: (2025)
von: Li, Wenhao, et al.
Veröffentlicht: (2025)
Training LLMs for EHR-Based Reasoning Tasks via Reinforcement Learning
von: Lin, Jiacheng, et al.
Veröffentlicht: (2025)
von: Lin, Jiacheng, et al.
Veröffentlicht: (2025)
SPIRAL: Self-Play on Zero-Sum Games Incentivizes Reasoning via Multi-Agent Multi-Turn Reinforcement Learning
von: Liu, Bo, et al.
Veröffentlicht: (2025)
von: Liu, Bo, et al.
Veröffentlicht: (2025)
AMONGAGENTS: Evaluating Large Language Models in the Interactive Text-Based Social Deduction Game
von: Chi, Yizhou, et al.
Veröffentlicht: (2024)
von: Chi, Yizhou, et al.
Veröffentlicht: (2024)
WebRL: Training LLM Web Agents via Self-Evolving Online Curriculum Reinforcement Learning
von: Qi, Zehan, et al.
Veröffentlicht: (2024)
von: Qi, Zehan, et al.
Veröffentlicht: (2024)
Multi-Dimensional Optimization for Text Summarization via Reinforcement Learning
von: Ryu, Sangwon, et al.
Veröffentlicht: (2024)
von: Ryu, Sangwon, et al.
Veröffentlicht: (2024)
TDAG: A Multi-Agent Framework based on Dynamic Task Decomposition and Agent Generation
von: Wang, Yaoxiang, et al.
Veröffentlicht: (2024)
von: Wang, Yaoxiang, et al.
Veröffentlicht: (2024)
Sticking to the Mean: Detecting Sticky Tokens in Text Embedding Models
von: Chen, Kexin, et al.
Veröffentlicht: (2025)
von: Chen, Kexin, et al.
Veröffentlicht: (2025)
Large Language Models as Agents in Two-Player Games
von: Liu, Yang, et al.
Veröffentlicht: (2024)
von: Liu, Yang, et al.
Veröffentlicht: (2024)
InfoFlow: Reinforcing Search Agent Via Reward Density Optimization
von: Luo, Kun, et al.
Veröffentlicht: (2025)
von: Luo, Kun, et al.
Veröffentlicht: (2025)
GTA: Supervised-Guided Reinforcement Learning for Text Classification with Large Language Models
von: Zeng, Min, et al.
Veröffentlicht: (2025)
von: Zeng, Min, et al.
Veröffentlicht: (2025)
Dynamic Affective Memory Management for Personalized LLM Agents
von: Lu, Junfeng, et al.
Veröffentlicht: (2025)
von: Lu, Junfeng, et al.
Veröffentlicht: (2025)
Ähnliche Einträge
-
Research on the Integration of Embodied Intelligence and Reinforcement Learning in Textual Domains
von: Wang, Haonan, et al.
Veröffentlicht: (2025) -
ByteSized32Refactored: Towards an Extensible Interactive Text Games Corpus for LLM World Modeling and Evaluation
von: Wang, Haonan, et al.
Veröffentlicht: (2025) -
Research on geometric figure classification algorithm based on Deep Learning
von: Wang, Ruiyang, et al.
Veröffentlicht: (2024) -
Learning to Rewrite: Generalized LLM-Generated Text Detection
von: Li, Ran, et al.
Veröffentlicht: (2024) -
Playing 20 Question Game with Policy-Based Reinforcement Learning
von: Hu, Huang, et al.
Veröffentlicht: (2018)