Gespeichert in:
| Hauptverfasser: | Zheng, Longtao, Huang, Zhiyuan, Xue, Zhenghai, Wang, Xinrun, An, Bo, Yan, Shuicheng |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2024
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2403.17918 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
Synapse: Trajectory-as-Exemplar Prompting with Memory for Computer Control
von: Zheng, Longtao, et al.
Veröffentlicht: (2023)
von: Zheng, Longtao, et al.
Veröffentlicht: (2023)
Group-in-Group Policy Optimization for LLM Agent Training
von: Feng, Lang, et al.
Veröffentlicht: (2025)
von: Feng, Lang, et al.
Veröffentlicht: (2025)
Policy Regularization on Globally Accessible States in Cross-Dynamics Reinforcement Learning
von: Xue, Zhenghai, et al.
Veröffentlicht: (2025)
von: Xue, Zhenghai, et al.
Veröffentlicht: (2025)
Cradle: Empowering Foundation Agents Towards General Computer Control
von: Tan, Weihao, et al.
Veröffentlicht: (2024)
von: Tan, Weihao, et al.
Veröffentlicht: (2024)
True Knowledge Comes from Practice: Aligning LLMs with Embodied Environments via Reinforcement Learning
von: Tan, Weihao, et al.
Veröffentlicht: (2024)
von: Tan, Weihao, et al.
Veröffentlicht: (2024)
ResearStudio: A Human-Intervenable Framework for Building Controllable Deep-Research Agents
von: Yang, Linyi, et al.
Veröffentlicht: (2025)
von: Yang, Linyi, et al.
Veröffentlicht: (2025)
Dr. MAS: Stable Reinforcement Learning for Multi-Agent LLM Systems
von: Feng, Lang, et al.
Veröffentlicht: (2026)
von: Feng, Lang, et al.
Veröffentlicht: (2026)
The Agent Use of Agent Beings: Agent Cybernetics Is the Missing Science of Foundation Agents
von: Wang, Xinrun, et al.
Veröffentlicht: (2026)
von: Wang, Xinrun, et al.
Veröffentlicht: (2026)
A Multimodal Foundation Agent for Financial Trading: Tool-Augmented, Diversified, and Generalist
von: Zhang, Wentao, et al.
Veröffentlicht: (2024)
von: Zhang, Wentao, et al.
Veröffentlicht: (2024)
Towards Efficient Online Tuning of VLM Agents via Counterfactual Soft Reinforcement Learning
von: Feng, Lang, et al.
Veröffentlicht: (2025)
von: Feng, Lang, et al.
Veröffentlicht: (2025)
MineStudio: A Streamlined Package for Minecraft AI Agent Development
von: Cai, Shaofei, et al.
Veröffentlicht: (2024)
von: Cai, Shaofei, et al.
Veröffentlicht: (2024)
SimWorld Studio: Automatic Environment Generation with Evolving Coding Agent for Embodied Agent Learning
von: Kang, Haoqiang, et al.
Veröffentlicht: (2026)
von: Kang, Haoqiang, et al.
Veröffentlicht: (2026)
SDialog: A Python Toolkit for End-to-End Agent Building, User Simulation, Dialog Generation, and Evaluation
von: Burdisso, Sergio, et al.
Veröffentlicht: (2025)
von: Burdisso, Sergio, et al.
Veröffentlicht: (2025)
PharmAgents: Building a Virtual Pharma with Large Language Model Agents
von: Gao, Bowen, et al.
Veröffentlicht: (2025)
von: Gao, Bowen, et al.
Veröffentlicht: (2025)
AutoGen Studio: A No-Code Developer Tool for Building and Debugging Multi-Agent Systems
von: Dibia, Victor, et al.
Veröffentlicht: (2024)
von: Dibia, Victor, et al.
Veröffentlicht: (2024)
SDialog: A Python Toolkit for End-to-End Agent Building, User Simulation, Dialog Generation, and Evaluation
von: Burdisso, Sergio, et al.
Veröffentlicht: (2025)
von: Burdisso, Sergio, et al.
Veröffentlicht: (2025)
BioMedArena: An Open-source Toolkit for Building and Evaluating Biomedical Deep Research Agents
von: Wu, Jinge, et al.
Veröffentlicht: (2026)
von: Wu, Jinge, et al.
Veröffentlicht: (2026)
Emerging from Ground: Addressing Intent Deviation in Tool-Using Agents via Deriving Real Calls into Virtual Trajectories
von: Xiong, Qian, et al.
Veröffentlicht: (2026)
von: Xiong, Qian, et al.
Veröffentlicht: (2026)
State Regularized Policy Optimization on Data with Dynamics Shift
von: Xue, Zhenghai, et al.
Veröffentlicht: (2023)
von: Xue, Zhenghai, et al.
Veröffentlicht: (2023)
IDAT: A Multi-Modal Dataset and Toolkit for Building and Evaluating Interactive Task-Solving Agents
von: Mohanty, Shrestha, et al.
Veröffentlicht: (2024)
von: Mohanty, Shrestha, et al.
Veröffentlicht: (2024)
Agent Lifecycle Toolkit (ALTK): Reusable Middleware Components for Robust AI Agents
von: Wright, Zidane, et al.
Veröffentlicht: (2026)
von: Wright, Zidane, et al.
Veröffentlicht: (2026)
GDBA Revisited: Unleashing the Power of Guided Local Search for Distributed Constraint Optimization
von: Deng, Yanchen, et al.
Veröffentlicht: (2025)
von: Deng, Yanchen, et al.
Veröffentlicht: (2025)
Toward Natural and Companionable Virtual Agents via Cross-Temporal Emotional Modeling
von: Qin, Feier, et al.
Veröffentlicht: (2026)
von: Qin, Feier, et al.
Veröffentlicht: (2026)
ColorAgent: Building A Robust, Personalized, and Interactive OS Agent
von: Li, Ning, et al.
Veröffentlicht: (2025)
von: Li, Ning, et al.
Veröffentlicht: (2025)
BrowserAgent: Building Web Agents with Human-Inspired Web Browsing Actions
von: Yu, Tao, et al.
Veröffentlicht: (2025)
von: Yu, Tao, et al.
Veröffentlicht: (2025)
A Survey on Game Playing Agents and Large Models: Methods, Applications, and Challenges
von: Xu, Xinrun, et al.
Veröffentlicht: (2024)
von: Xu, Xinrun, et al.
Veröffentlicht: (2024)
The Optimal Token Baseline: Variance Reduction for Long-Horizon LLM-RL
von: Li, Yingru, et al.
Veröffentlicht: (2026)
von: Li, Yingru, et al.
Veröffentlicht: (2026)
Virtual Agent Economies
von: Tomasev, Nenad, et al.
Veröffentlicht: (2025)
von: Tomasev, Nenad, et al.
Veröffentlicht: (2025)
CentaurTA Studio: A Self-Improving Human-Agent Collaboration System for Thematic Analysis
von: Wang, Lei, et al.
Veröffentlicht: (2026)
von: Wang, Lei, et al.
Veröffentlicht: (2026)
How Foundational Skills Influence VLM-based Embodied Agents:A Native Perspective
von: Peng, Bo, et al.
Veröffentlicht: (2026)
von: Peng, Bo, et al.
Veröffentlicht: (2026)
Visual Document Understanding and Reasoning: A Multi-Agent Collaboration Framework with Agent-Wise Adaptive Test-Time Scaling
von: Yu, Xinlei, et al.
Veröffentlicht: (2025)
von: Yu, Xinlei, et al.
Veröffentlicht: (2025)
MoE++: Accelerating Mixture-of-Experts Methods with Zero-Computation Experts
von: Jin, Peng, et al.
Veröffentlicht: (2024)
von: Jin, Peng, et al.
Veröffentlicht: (2024)
AgentRM: Enhancing Agent Generalization with Reward Modeling
von: Xia, Yu, et al.
Veröffentlicht: (2025)
von: Xia, Yu, et al.
Veröffentlicht: (2025)
ImAgent: A Unified Multimodal Agent Framework for Test-Time Scalable Image Generation
von: Wang, Kaishen, et al.
Veröffentlicht: (2025)
von: Wang, Kaishen, et al.
Veröffentlicht: (2025)
See and Think: Embodied Agent in Virtual Environment
von: Zhao, Zhonghan, et al.
Veröffentlicht: (2023)
von: Zhao, Zhonghan, et al.
Veröffentlicht: (2023)
ICON: Indirect Prompt Injection Defense for Agents based on Inference-Time Correction
von: Wang, Che, et al.
Veröffentlicht: (2026)
von: Wang, Che, et al.
Veröffentlicht: (2026)
AblateCell: A Reproduce-then-Ablate Agent for Virtual Cell Repositories
von: Xia, Xue, et al.
Veröffentlicht: (2026)
von: Xia, Xue, et al.
Veröffentlicht: (2026)
AutoFPDesigner: Automated Flight Procedure Design Based on Multi-Agent Large Language Model
von: Zhu, Longtao, et al.
Veröffentlicht: (2024)
von: Zhu, Longtao, et al.
Veröffentlicht: (2024)
AgentGate: A Lightweight Structured Routing Engine for the Internet of Agents
von: Cheng, Yujun, et al.
Veröffentlicht: (2026)
von: Cheng, Yujun, et al.
Veröffentlicht: (2026)
Efficient Agents: Building Effective Agents While Reducing Cost
von: Wang, Ningning, et al.
Veröffentlicht: (2025)
von: Wang, Ningning, et al.
Veröffentlicht: (2025)
Ähnliche Einträge
-
Synapse: Trajectory-as-Exemplar Prompting with Memory for Computer Control
von: Zheng, Longtao, et al.
Veröffentlicht: (2023) -
Group-in-Group Policy Optimization for LLM Agent Training
von: Feng, Lang, et al.
Veröffentlicht: (2025) -
Policy Regularization on Globally Accessible States in Cross-Dynamics Reinforcement Learning
von: Xue, Zhenghai, et al.
Veröffentlicht: (2025) -
Cradle: Empowering Foundation Agents Towards General Computer Control
von: Tan, Weihao, et al.
Veröffentlicht: (2024) -
True Knowledge Comes from Practice: Aligning LLMs with Embodied Environments via Reinforcement Learning
von: Tan, Weihao, et al.
Veröffentlicht: (2024)