Enregistré dans:
| Auteurs principaux: | Yeganeh, Yavar Taheri, Jafari, Mohsen, Matta, Andrea |
|---|---|
| Format: | Preprint |
| Publié: |
2025
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2505.19867 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
Active Inference Meeting Energy-Efficient Control of Parallel and Identical Machines
par: Yeganeh, Yavar Taheri, et autres
Publié: (2024)
par: Yeganeh, Yavar Taheri, et autres
Publié: (2024)
Active Inference for Energy Control and Planning in Smart Buildings and Communities
par: Nazemi, Seyyed Danial, et autres
Publié: (2025)
par: Nazemi, Seyyed Danial, et autres
Publié: (2025)
Reinforcement Learning for Long-Horizon Interactive LLM Agents
par: Chen, Kevin, et autres
Publié: (2025)
par: Chen, Kevin, et autres
Publié: (2025)
Hindsight Credit Assignment for Long-Horizon LLM Agents
par: Tan, Hui-Ze, et autres
Publié: (2026)
par: Tan, Hui-Ze, et autres
Publié: (2026)
The Effective Horizon Explains Deep RL Performance in Stochastic Environments
par: Laidlaw, Cassidy, et autres
Publié: (2023)
par: Laidlaw, Cassidy, et autres
Publié: (2023)
Reinforcement Learning via Conservative Agent for Environments with Random Delays
par: Lee, Jongsoo, et autres
Publié: (2025)
par: Lee, Jongsoo, et autres
Publié: (2025)
AgentFold: Long-Horizon Web Agents with Proactive Context Management
par: Ye, Rui, et autres
Publié: (2025)
par: Ye, Rui, et autres
Publié: (2025)
FoldAct: Efficient and Stable Context Folding for Long-Horizon Search Agents
par: Shao, Jiaqi, et autres
Publié: (2025)
par: Shao, Jiaqi, et autres
Publié: (2025)
HiMAC: Hierarchical Macro-Micro Learning for Long-Horizon LLM Agents
par: Jin, Hongbo, et autres
Publié: (2026)
par: Jin, Hongbo, et autres
Publié: (2026)
Fathom-DeepResearch: Unlocking Long Horizon Information Retrieval and Synthesis for SLMs
par: Singh, Shreyas, et autres
Publié: (2025)
par: Singh, Shreyas, et autres
Publié: (2025)
Anomaly Prediction: A Novel Approach with Explicit Delay and Horizon
par: You, Jiang, et autres
Publié: (2024)
par: You, Jiang, et autres
Publié: (2024)
Hierarchical Two-Stage Framework for Environment-Aware Long-Horizon Vessel Trajectory Prediction
par: Gnanavel, Ganeshaaraj, et autres
Publié: (2026)
par: Gnanavel, Ganeshaaraj, et autres
Publié: (2026)
RLVMR: Reinforcement Learning with Verifiable Meta-Reasoning Rewards for Robust Long-Horizon Agents
par: Zhang, Zijing, et autres
Publié: (2025)
par: Zhang, Zijing, et autres
Publié: (2025)
TRIP-Bench: A Benchmark for Long-Horizon Interactive Agents in Real-World Scenarios
par: Shen, Yuanzhe, et autres
Publié: (2026)
par: Shen, Yuanzhe, et autres
Publié: (2026)
Generalization and Membership Inference Attack a Practical Perspective
par: Rahmani, Fateme, et autres
Publié: (2026)
par: Rahmani, Fateme, et autres
Publié: (2026)
ICA: Information-Aware Credit Assignment for Visually Grounded Long-Horizon Information-Seeking Agents
par: Pang, Cong, et autres
Publié: (2026)
par: Pang, Cong, et autres
Publié: (2026)
SkillTree: Explainable Skill-Based Deep Reinforcement Learning for Long-Horizon Control Tasks
par: Wen, Yongyan, et autres
Publié: (2024)
par: Wen, Yongyan, et autres
Publié: (2024)
HINT-SD: Targeted Hindsight Self-Distillation for Long-Horizon Agents
par: Yeo, Woongyeng, et autres
Publié: (2026)
par: Yeo, Woongyeng, et autres
Publié: (2026)
A Subgoal-driven Framework for Improving Long-Horizon LLM Agents
par: Wang, Taiyi, et autres
Publié: (2026)
par: Wang, Taiyi, et autres
Publié: (2026)
LongCoT: Benchmarking Long-Horizon Chain-of-Thought Reasoning
par: Motwani, Sumeet Ramesh, et autres
Publié: (2026)
par: Motwani, Sumeet Ramesh, et autres
Publié: (2026)
Implicit Strategic Optimization: Rethinking Long-Horizon Decision-Making in Adversarial Poker Environments
par: Xia, Boyang, et autres
Publié: (2026)
par: Xia, Boyang, et autres
Publié: (2026)
On Training Large Language Models for Long-Horizon Tasks: An Empirical Study of Horizon Length
par: Kim, Sunghwan, et autres
Publié: (2026)
par: Kim, Sunghwan, et autres
Publié: (2026)
Intrinsic Credit Assignment for Long Horizon Interaction
par: Auzina, Ilze Amanda, et autres
Publié: (2026)
par: Auzina, Ilze Amanda, et autres
Publié: (2026)
Sensi: Learn One Thing at a Time -- Curriculum-Based Test-Time Learning for LLM Game Agents
par: Arjmandi, Mohsen
Publié: (2026)
par: Arjmandi, Mohsen
Publié: (2026)
Can We Rely on LLM Agents to Draft Long-Horizon Plans? Let's Take TravelPlanner as an Example
par: Chen, Yanan, et autres
Publié: (2024)
par: Chen, Yanan, et autres
Publié: (2024)
Learning Multi-Agent Loco-Manipulation for Long-Horizon Quadrupedal Pushing
par: Feng, Yuming, et autres
Publié: (2024)
par: Feng, Yuming, et autres
Publié: (2024)
2048: Reinforcement Learning in a Delayed Reward Environment
par: Saligram, Prady, et autres
Publié: (2025)
par: Saligram, Prady, et autres
Publié: (2025)
ColorGrid: A Multi-Agent Non-Stationary Environment for Goal Inference and Assistance
par: Risukhin, Andrey, et autres
Publié: (2025)
par: Risukhin, Andrey, et autres
Publié: (2025)
Complex-Valued Unitary Representations as Classification Heads for Improved Uncertainty Quantification in Deep Neural Networks
par: Jafari, Akbar Anbar, et autres
Publié: (2026)
par: Jafari, Akbar Anbar, et autres
Publié: (2026)
The Oversight Game: Learning to Cooperatively Balance an AI Agent's Safety and Autonomy
par: Overman, William, et autres
Publié: (2025)
par: Overman, William, et autres
Publié: (2025)
MTSQL-R1: Towards Long-Horizon Multi-Turn Text-to-SQL via Agentic Training
par: Guo, Taicheng, et autres
Publié: (2025)
par: Guo, Taicheng, et autres
Publié: (2025)
Solving the Granularity Mismatch: Hierarchical Preference Learning for Long-Horizon LLM Agents
par: Gao, Heyang, et autres
Publié: (2025)
par: Gao, Heyang, et autres
Publié: (2025)
AMA-Bench: Evaluating Long-Horizon Memory for Agentic Applications
par: Zhao, Yujie, et autres
Publié: (2026)
par: Zhao, Yujie, et autres
Publié: (2026)
Hierarchy-of-Groups Policy Optimization for Long-Horizon Agentic Tasks
par: He, Shuo, et autres
Publié: (2026)
par: He, Shuo, et autres
Publié: (2026)
Impatient Bandits: Optimizing for the Long-Term Without Delay
par: Zhang, Kelly W., et autres
Publié: (2025)
par: Zhang, Kelly W., et autres
Publié: (2025)
AgentGym-RL: Training LLM Agents for Long-Horizon Decision Making through Multi-Turn Reinforcement Learning
par: Xi, Zhiheng, et autres
Publié: (2025)
par: Xi, Zhiheng, et autres
Publié: (2025)
Compressing Deep Neural Networks Using Explainable AI
par: Soroush, Kimia, et autres
Publié: (2025)
par: Soroush, Kimia, et autres
Publié: (2025)
Refining Compositional Diffusion for Reliable Long-Horizon Planning
par: Lee, Kyowoon, et autres
Publié: (2026)
par: Lee, Kyowoon, et autres
Publié: (2026)
Proactive Agent Research Environment: Simulating Active Users to Evaluate Proactive Assistants
par: Nathani, Deepak, et autres
Publié: (2026)
par: Nathani, Deepak, et autres
Publié: (2026)
Learning for Long-Horizon Planning via Neuro-Symbolic Abductive Imitation
par: Shao, Jie-Jing, et autres
Publié: (2024)
par: Shao, Jie-Jing, et autres
Publié: (2024)
Documents similaires
-
Active Inference Meeting Energy-Efficient Control of Parallel and Identical Machines
par: Yeganeh, Yavar Taheri, et autres
Publié: (2024) -
Active Inference for Energy Control and Planning in Smart Buildings and Communities
par: Nazemi, Seyyed Danial, et autres
Publié: (2025) -
Reinforcement Learning for Long-Horizon Interactive LLM Agents
par: Chen, Kevin, et autres
Publié: (2025) -
Hindsight Credit Assignment for Long-Horizon LLM Agents
par: Tan, Hui-Ze, et autres
Publié: (2026) -
The Effective Horizon Explains Deep RL Performance in Stochastic Environments
par: Laidlaw, Cassidy, et autres
Publié: (2023)