:: Library Catalog

Buchumschlag

Gespeichert in:

Bibliographische Detailangaben
Hauptverfasser:	Wang, Haonan, Zhao, Mingjia, Sun, Junfeng, Liu, Wei
Format:	Preprint
Veröffentlicht:	2025
Schlagworte:	Computation and Language
Online-Zugang:	https://arxiv.org/abs/2509.03479
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Ähnliche Einträge

Research on the Integration of Embodied Intelligence and Reinforcement Learning in Textual Domains
von: Wang, Haonan, et al.
Veröffentlicht: (2025)

ByteSized32Refactored: Towards an Extensible Interactive Text Games Corpus for LLM World Modeling and Evaluation
von: Wang, Haonan, et al.
Veröffentlicht: (2025)

Research on geometric figure classification algorithm based on Deep Learning
von: Wang, Ruiyang, et al.
Veröffentlicht: (2024)

Learning to Rewrite: Generalized LLM-Generated Text Detection
von: Li, Ran, et al.
Veröffentlicht: (2024)

Playing 20 Question Game with Policy-Based Reinforcement Learning
von: Hu, Huang, et al.
Veröffentlicht: (2018)

Monte Carlo Planning with Large Language Model for Text-Based Game Agents
von: Shi, Zijing, et al.
Veröffentlicht: (2025)

TextGames: Learning to Self-Play Text-Based Puzzle Games via Language Model Reasoning
von: Hudi, Frederikus, et al.
Veröffentlicht: (2025)

Persona Dynamics: Unveiling the Impact of Personality Traits on Agents in Text-Based Games
von: Lim, Seungwon, et al.
Veröffentlicht: (2025)

GAP: Graph-Based Agent Planning with Parallel Tool Use and Reinforcement Learning
von: Wu, Jiaqi, et al.
Veröffentlicht: (2025)

DynaWeb: Model-Based Reinforcement Learning of Web Agents
von: Ding, Hang, et al.
Veröffentlicht: (2026)

A Text-to-Game Engine for UGC-Based Role-Playing Games
von: Zhang, Lei, et al.
Veröffentlicht: (2024)

Looking Beyond Text: Reducing Language bias in Large Vision-Language Models via Multimodal Dual-Attention and Soft-Image Guidance
von: Zhao, Haozhe, et al.
Veröffentlicht: (2024)

Reinforcing Code Generation: Improving Text-to-SQL with Execution-Based Learning
von: Kulkarni, Atharv, et al.
Veröffentlicht: (2025)

On the Effects of Fine-tuning Language Models for Text-Based Reinforcement Learning
von: Gruppi, Mauricio, et al.
Veröffentlicht: (2024)

EVA: Efficient Reinforcement Learning for End-to-End Video Agent
von: Zhang, Yaolun, et al.
Veröffentlicht: (2026)

TextQuests: How Good are LLMs at Text-Based Video Games?
von: Phan, Long, et al.
Veröffentlicht: (2025)

Dynamic Optimizations of LLM Ensembles with Two-Stage Reinforcement Learning Agents
von: Tekin, Selim Furkan, et al.
Veröffentlicht: (2025)

Balancing Rewards in Text Summarization: Multi-Objective Reinforcement Learning via HyperVolume Optimization
von: Song, Junjie, et al.
Veröffentlicht: (2025)

Well Begun, Half Done: Reinforcement Learning with Prefix Optimization for LLM Reasoning
von: Sun, Yiliu, et al.
Veröffentlicht: (2025)

EPO: Entropy-regularized Policy Optimization for LLM Agents Reinforcement Learning
von: Xu, Wujiang, et al.
Veröffentlicht: (2025)

MHPO: Modulated Hazard-aware Policy Optimization for Stable Reinforcement Learning
von: Wang, Hongjun, et al.
Veröffentlicht: (2026)

Optima: Optimizing Effectiveness and Efficiency for LLM-Based Multi-Agent System
von: Chen, Weize, et al.
Veröffentlicht: (2024)

GAPD: Gold-Action Policy Distillation for Agentic Reinforcement Learning in Knowledge Base Question Answering
von: Sun, Xin, et al.
Veröffentlicht: (2026)

Reinforcement Learning for Compositional Generalization with Outcome-Level Optimization
von: Fu, Xiyan, et al.
Veröffentlicht: (2026)

AgentGL: Towards Agentic Graph Learning with LLMs via Reinforcement Learning
von: Sun, Yuanfu, et al.
Veröffentlicht: (2026)

Commonsense Knowledge Editing Based on Free-Text in LLMs
von: Huang, Xiusheng, et al.
Veröffentlicht: (2024)

Beyond the Turn-Based Game: Enabling Real-Time Conversations with Duplex Models
von: Zhang, Xinrong, et al.
Veröffentlicht: (2024)

Monocle: Hybrid Local-Global In-Context Evaluation for Long-Text Generation with Uncertainty-Based Active Learning
von: Wang, Xiaorong, et al.
Veröffentlicht: (2025)

TextAtari: 100K Frames Game Playing with Language Agents
von: Li, Wenhao, et al.
Veröffentlicht: (2025)

Training LLMs for EHR-Based Reasoning Tasks via Reinforcement Learning
von: Lin, Jiacheng, et al.
Veröffentlicht: (2025)

SPIRAL: Self-Play on Zero-Sum Games Incentivizes Reasoning via Multi-Agent Multi-Turn Reinforcement Learning
von: Liu, Bo, et al.
Veröffentlicht: (2025)

AMONGAGENTS: Evaluating Large Language Models in the Interactive Text-Based Social Deduction Game
von: Chi, Yizhou, et al.
Veröffentlicht: (2024)

WebRL: Training LLM Web Agents via Self-Evolving Online Curriculum Reinforcement Learning
von: Qi, Zehan, et al.
Veröffentlicht: (2024)

Multi-Dimensional Optimization for Text Summarization via Reinforcement Learning
von: Ryu, Sangwon, et al.
Veröffentlicht: (2024)

TDAG: A Multi-Agent Framework based on Dynamic Task Decomposition and Agent Generation
von: Wang, Yaoxiang, et al.
Veröffentlicht: (2024)

Sticking to the Mean: Detecting Sticky Tokens in Text Embedding Models
von: Chen, Kexin, et al.
Veröffentlicht: (2025)

Large Language Models as Agents in Two-Player Games
von: Liu, Yang, et al.
Veröffentlicht: (2024)

InfoFlow: Reinforcing Search Agent Via Reward Density Optimization
von: Luo, Kun, et al.
Veröffentlicht: (2025)

GTA: Supervised-Guided Reinforcement Learning for Text Classification with Large Language Models
von: Zeng, Min, et al.
Veröffentlicht: (2025)

Dynamic Affective Memory Management for Personalized LLM Agents
von: Lu, Junfeng, et al.
Veröffentlicht: (2025)