Enregistré dans:
| Auteurs principaux: | Feng, Xinshun, Song, Xinhao, Li, Lijun, Liu, Gongshen, Shao, Jing |
|---|---|
| Format: | Preprint |
| Publié: |
2026
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2604.07791 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
Experience-Evolving Multi-Turn Tool-Use Agent with Hybrid Episodic-Procedural Memory
par: Li, Sijia, et autres
Publié: (2025)
par: Li, Sijia, et autres
Publié: (2025)
MemSkill: Learning and Evolving Memory Skills for Self-Evolving Agents
par: Zhang, Haozhen, et autres
Publié: (2026)
par: Zhang, Haozhen, et autres
Publié: (2026)
PolicyEvol-Agent: Evolving Policy via Environment Perception and Self-Awareness with Theory of Mind
par: Yu, Yajie, et autres
Publié: (2025)
par: Yu, Yajie, et autres
Publié: (2025)
One-Way Policy Optimization for Self-Evolving LLMs
par: Yang, Shuo, et autres
Publié: (2026)
par: Yang, Shuo, et autres
Publié: (2026)
EvolveMem:Self-Evolving Memory Architecture via AutoResearch for LLM Agents
par: Liu, Jiaqi, et autres
Publié: (2026)
par: Liu, Jiaqi, et autres
Publié: (2026)
Your Agent May Misevolve: Emergent Risks in Self-evolving LLM Agents
par: Shao, Shuai, et autres
Publié: (2025)
par: Shao, Shuai, et autres
Publié: (2025)
APEX: Autonomous Policy Exploration for Self-Evolving LLM Agents
par: Li, Yibo, et autres
Publié: (2026)
par: Li, Yibo, et autres
Publié: (2026)
Metis: Learning to Jailbreak LLMs via Self-Evolving Metacognitive Policy Optimization
par: Zhou, Huilin, et autres
Publié: (2026)
par: Zhou, Huilin, et autres
Publié: (2026)
HLL: Can Agents Cross Humanity's Last Line of Verification?
par: Song, Xinhao, et autres
Publié: (2026)
par: Song, Xinhao, et autres
Publié: (2026)
MUSE-Autoskill: Self-Evolving Agents via Skill Creation, Memory, Management, and Evaluation
par: Lin, Huawei, et autres
Publié: (2026)
par: Lin, Huawei, et autres
Publié: (2026)
Exploratory Memory-Augmented LLM Agent via Hybrid On- and Off-Policy Optimization
par: Liu, Zeyuan, et autres
Publié: (2026)
par: Liu, Zeyuan, et autres
Publié: (2026)
Self-Evolving Recommendation System: End-To-End Autonomous Model Optimization With LLM Agents
par: Wang, Haochen, et autres
Publié: (2026)
par: Wang, Haochen, et autres
Publié: (2026)
EvoMemBench: Benchmarking Agent Memory from a Self-Evolving Perspective
par: Wang, Yuyao, et autres
Publié: (2026)
par: Wang, Yuyao, et autres
Publié: (2026)
Group-in-Group Policy Optimization for LLM Agent Training
par: Feng, Lang, et autres
Publié: (2025)
par: Feng, Lang, et autres
Publié: (2025)
AgentEvolver: Towards Efficient Self-Evolving Agent System
par: Zhai, Yunpeng, et autres
Publié: (2025)
par: Zhai, Yunpeng, et autres
Publié: (2025)
Do Neural Scaling Laws Exist on Graph Self-Supervised Learning?
par: Ma, Qian, et autres
Publié: (2024)
par: Ma, Qian, et autres
Publié: (2024)
ContextEvolve: Multi-Agent Context Compression for Systems Code Optimization
par: Su, Hongyuan, et autres
Publié: (2026)
par: Su, Hongyuan, et autres
Publié: (2026)
PolicyEvolve: Evolving Programmatic Policies by LLMs for multi-player games via Population-Based Training
par: Lv, Mingrui, et autres
Publié: (2025)
par: Lv, Mingrui, et autres
Publié: (2025)
Symbolic Learning Enables Self-Evolving Agents
par: Zhou, Wangchunshu, et autres
Publié: (2024)
par: Zhou, Wangchunshu, et autres
Publié: (2024)
A Self-Evolving AI Agent System for Climate Science
par: Guo, Zijie, et autres
Publié: (2025)
par: Guo, Zijie, et autres
Publié: (2025)
Reason in Chains, Learn in Trees: Self-Rectification and Grafting for Multi-turn Agent Policy Optimization
par: Li, Yu, et autres
Publié: (2026)
par: Li, Yu, et autres
Publié: (2026)
Graph-attention-based Casual Discovery with Trust Region-navigated Clipping Policy Optimization
par: Liu, Shixuan, et autres
Publié: (2024)
par: Liu, Shixuan, et autres
Publié: (2024)
P^2O: Joint Policy and Prompt Optimization
par: Lu, Xinyu, et autres
Publié: (2026)
par: Lu, Xinyu, et autres
Publié: (2026)
PALADIN: Self-Correcting Language Model Agents to Cure Tool-Failure Cases
par: Vuddanti, Sri Vatsa, et autres
Publié: (2025)
par: Vuddanti, Sri Vatsa, et autres
Publié: (2025)
GraphRCG: Self-Conditioned Graph Generation
par: Wang, Song, et autres
Publié: (2024)
par: Wang, Song, et autres
Publié: (2024)
FedRS-Bench: Realistic Federated Learning Datasets and Benchmarks in Remote Sensing
par: Zhao, Haodong, et autres
Publié: (2025)
par: Zhao, Haodong, et autres
Publié: (2025)
CMKL: Modality-Aware Continual Learning for Evolving Biomedical Knowledge Graphs
par: Radwan, Yousef A., et autres
Publié: (2026)
par: Radwan, Yousef A., et autres
Publié: (2026)
EvoMem: Improving Multi-Agent Planning with Dual-Evolving Memory
par: Fan, Wenzhe, et autres
Publié: (2025)
par: Fan, Wenzhe, et autres
Publié: (2025)
FORGE: Self-Evolving Agent Memory With No Weight Updates via Population Broadcast
par: Bogdanov, Igor, et autres
Publié: (2026)
par: Bogdanov, Igor, et autres
Publié: (2026)
MMG2Skill: Can Agents Distill In-the-Wild Guides into Self-Evolving Skills?
par: Che, Xinyu, et autres
Publié: (2026)
par: Che, Xinyu, et autres
Publié: (2026)
Unifying Group-Relative and Self-Distillation Policy Optimization via Sample Routing
par: Li, Gengsheng, et autres
Publié: (2026)
par: Li, Gengsheng, et autres
Publié: (2026)
Polymath: A Self-Optimizing Agent with Dynamic Hierarchical Workflow
par: Ho, Chia-Tung, et autres
Publié: (2025)
par: Ho, Chia-Tung, et autres
Publié: (2025)
SkillGraph: Graph Foundation Priors for LLM Agent Tool Sequence Recommendation
par: Liu, Hao, et autres
Publié: (2026)
par: Liu, Hao, et autres
Publié: (2026)
MASPO: Joint Prompt Optimization for LLM-based Multi-Agent Systems
par: Wang, Zhexuan, et autres
Publié: (2026)
par: Wang, Zhexuan, et autres
Publié: (2026)
Hybrid Self-evolving Structured Memory for GUI Agents
par: Zhu, Sibo, et autres
Publié: (2026)
par: Zhu, Sibo, et autres
Publié: (2026)
Maestro: Joint Graph & Config Optimization for Reliable AI Agents
par: Wang, Wenxiao, et autres
Publié: (2025)
par: Wang, Wenxiao, et autres
Publié: (2025)
Long Term Memory: The Foundation of AI Self-Evolution
par: Jiang, Xun, et autres
Publié: (2024)
par: Jiang, Xun, et autres
Publié: (2024)
An Evolved Universal Transformer Memory
par: Cetin, Edoardo, et autres
Publié: (2024)
par: Cetin, Edoardo, et autres
Publié: (2024)
Graph Diffusion Policy Optimization
par: Liu, Yijing, et autres
Publié: (2024)
par: Liu, Yijing, et autres
Publié: (2024)
Offline Multi-Agent Reinforcement Learning via In-Sample Sequential Policy Optimization
par: Liu, Zongkai, et autres
Publié: (2024)
par: Liu, Zongkai, et autres
Publié: (2024)
Documents similaires
-
Experience-Evolving Multi-Turn Tool-Use Agent with Hybrid Episodic-Procedural Memory
par: Li, Sijia, et autres
Publié: (2025) -
MemSkill: Learning and Evolving Memory Skills for Self-Evolving Agents
par: Zhang, Haozhen, et autres
Publié: (2026) -
PolicyEvol-Agent: Evolving Policy via Environment Perception and Self-Awareness with Theory of Mind
par: Yu, Yajie, et autres
Publié: (2025) -
One-Way Policy Optimization for Self-Evolving LLMs
par: Yang, Shuo, et autres
Publié: (2026) -
EvolveMem:Self-Evolving Memory Architecture via AutoResearch for LLM Agents
par: Liu, Jiaqi, et autres
Publié: (2026)