:: Library Catalog

Buchumschlag

Gespeichert in:

Bibliographische Detailangaben
Hauptverfasser:	Ye, Shicheng, Yu, Chao, Ke, Kaiqiang, Xu, Chengdong, Wei, Yinqi
Format:	Preprint
Veröffentlicht:	2025
Schlagworte:	Artificial Intelligence
Online-Zugang:	https://arxiv.org/abs/2509.12810
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Ähnliche Einträge

EvoMAS: Learning Execution-Time Workflows for Multi-Agent Systems
von: Xu, Chengdong, et al.
Veröffentlicht: (2026)

Context-Picker: Dynamic context selection using multi-stage reinforcement learning
von: Zhu, Siyuan, et al.
Veröffentlicht: (2025)

GCHR : Goal-Conditioned Hindsight Regularization for Sample-Efficient Reinforcement Learning
von: Lei, Xing, et al.
Veröffentlicht: (2025)

Hindsight Credit Assignment for Long-Horizon LLM Agents
von: Tan, Hui-Ze, et al.
Veröffentlicht: (2026)

AgentHER: Hindsight Experience Replay for LLM Agent Trajectory Relabeling
von: Ding, Liang
Veröffentlicht: (2026)

Hindsight is 20/20: Building Agent Memory that Retains, Recalls, and Reflects
von: Latimer, Chris, et al.
Veröffentlicht: (2025)

Reinforcement Learning with Knowledge Representation and Reasoning: A Brief Survey
von: Yu, Chao, et al.
Veröffentlicht: (2023)

What and When to Distill: Selective Hindsight Distillation for Multi-Turn Agents
von: Li, Xiaozhe, et al.
Veröffentlicht: (2026)

HISR: Hindsight Information Modulated Segmental Process Rewards For Multi-turn Agentic Reinforcement Learning
von: Lu, Zhicong, et al.
Veröffentlicht: (2026)

Hindsight-Anchored Policy Optimization: Turning Failure into Feedback in Sparse Reward Settings
von: Wu, Yuning, et al.
Veröffentlicht: (2026)

ZipRL: Adaptive Multi-Turn Context Compression with Hindsight Response Replay
von: Hu, Zhexin, et al.
Veröffentlicht: (2026)

MRHER: Model-based Relay Hindsight Experience Replay for Sequential Object Manipulation Tasks with Sparse Rewards
von: Huang, Yuming, et al.
Veröffentlicht: (2023)

Cluster-based Sampling in Hindsight Experience Replay for Robotic Tasks (Student Abstract)
von: Kim, Taeyoung, et al.
Veröffentlicht: (2022)

Hierarchical LLM-Based Multi-Agent Framework with Prompt Optimization for Multi-Robot Task Planning
von: Kawabe, Tomoya, et al.
Veröffentlicht: (2026)

HiFo-Prompt: Prompting with Hindsight and Foresight for LLM-based Automatic Heuristic Design
von: Chen, Chentong, et al.
Veröffentlicht: (2025)

Meta-Agent: From Task Descriptions to Verified Multi-Agent Systems
von: Xu, Andy, et al.
Veröffentlicht: (2026)

Hindsight Preference Optimization for Financial Time Series Advisory
von: Cui, Yanwei, et al.
Veröffentlicht: (2026)

Interactive Dialogue Agents via Reinforcement Learning on Hindsight Regenerations
von: Hong, Joey, et al.
Veröffentlicht: (2024)

Agent-R: Training Language Model Agents to Reflect via Iterative Self-Training
von: Yuan, Siyu, et al.
Veröffentlicht: (2025)

MemR$^3$: Memory Retrieval via Reflective Reasoning for LLM Agents
von: Du, Xingbo, et al.
Veröffentlicht: (2025)

GAM: Hierarchical Graph-based Agentic Memory for LLM Agents
von: Wu, Zhaofen, et al.
Veröffentlicht: (2026)

HINT-SD: Targeted Hindsight Self-Distillation for Long-Horizon Agents
von: Yeo, Woongyeng, et al.
Veröffentlicht: (2026)

Hierarchical Consensus-Based Multi-Agent Reinforcement Learning for Multi-Robot Cooperation Tasks
von: Feng, Pu, et al.
Veröffentlicht: (2024)

MAHL: Multi-Agent LLM-Guided Hierarchical Chiplet Design with Adaptive Debugging
von: Tang, Jinwei, et al.
Veröffentlicht: (2025)

StackPlanner: A Centralized Hierarchical Multi-Agent System with Task-Experience Memory Management
von: Zhang, Ruizhe, et al.
Veröffentlicht: (2026)

LLM-Powered Hierarchical Language Agent for Real-time Human-AI Coordination
von: Liu, Jijia, et al.
Veröffentlicht: (2023)

Constraint-Aware Route Recommendation from Natural Language via Hierarchical LLM Agents
von: Zhe, Tao, et al.
Veröffentlicht: (2025)

A Survey on Self-play Methods in Reinforcement Learning
von: Zhang, Ruize, et al.
Veröffentlicht: (2024)

Task Memory Engine: Spatial Memory for Robust Multi-Step LLM Agents
von: Ye, Ye
Veröffentlicht: (2025)

Task Memory Engine (TME): Enhancing State Awareness for Multi-Step LLM Agent Tasks
von: Ye, Ye
Veröffentlicht: (2025)

Contact Energy Based Hindsight Experience Prioritization
von: Sayar, Erdi, et al.
Veröffentlicht: (2023)

Reinforce LLM Reasoning through Multi-Agent Reflection
von: Yuan, Yurun, et al.
Veröffentlicht: (2025)

Hindsight Hint Distillation: Scaffolded Reasoning for SWE Agents from CoT-free Answers
von: Wang, Shengjie, et al.
Veröffentlicht: (2026)

Cross-Task Experiential Learning on LLM-based Multi-Agent Collaboration
von: Li, Yilong, et al.
Veröffentlicht: (2025)

R^3: Replay, Reflection, and Ranking Rewards for LLM Reinforcement Learning
von: Jiang, Zhizheng, et al.
Veröffentlicht: (2026)

Hindsight Preference Learning for Offline Preference-based Reinforcement Learning
von: Gao, Chen-Xiao, et al.
Veröffentlicht: (2024)

Visual Hindsight Self-Imitation Learning for Interactive Navigation
von: Kim, Kibeom, et al.
Veröffentlicht: (2023)

Meta-Policy Reflexion: Reusable Reflective Memory and Rule Admissibility for Resource-Efficient LLM Agent
von: Wu, Chunlong, et al.
Veröffentlicht: (2025)

$C^3$-Bench: The Things Real Disturbing LLM based Agent in Multi-Tasking
von: Yu, Peijie, et al.
Veröffentlicht: (2025)

Controllable and Reliable Knowledge-Intensive Task-Oriented Conversational Agents with Declarative Genie Worksheets
von: Joshi, Harshit, et al.
Veröffentlicht: (2024)