:: Library Catalog

Image de couverture de livre

Enregistré dans:

Détails bibliographiques
Auteurs principaux:	Yeganeh, Yavar Taheri, Jafari, Mohsen, Matta, Andrea
Format:	Preprint
Publié:	2025
Sujets:	Machine Learning Artificial Intelligence
Accès en ligne:	https://arxiv.org/abs/2505.19867
Tags:	Ajouter un tag Pas de tags, Soyez le premier à ajouter un tag!

Documents similaires

Active Inference Meeting Energy-Efficient Control of Parallel and Identical Machines
par: Yeganeh, Yavar Taheri, et autres
Publié: (2024)

Active Inference for Energy Control and Planning in Smart Buildings and Communities
par: Nazemi, Seyyed Danial, et autres
Publié: (2025)

Reinforcement Learning for Long-Horizon Interactive LLM Agents
par: Chen, Kevin, et autres
Publié: (2025)

Hindsight Credit Assignment for Long-Horizon LLM Agents
par: Tan, Hui-Ze, et autres
Publié: (2026)

The Effective Horizon Explains Deep RL Performance in Stochastic Environments
par: Laidlaw, Cassidy, et autres
Publié: (2023)

Reinforcement Learning via Conservative Agent for Environments with Random Delays
par: Lee, Jongsoo, et autres
Publié: (2025)

AgentFold: Long-Horizon Web Agents with Proactive Context Management
par: Ye, Rui, et autres
Publié: (2025)

FoldAct: Efficient and Stable Context Folding for Long-Horizon Search Agents
par: Shao, Jiaqi, et autres
Publié: (2025)

HiMAC: Hierarchical Macro-Micro Learning for Long-Horizon LLM Agents
par: Jin, Hongbo, et autres
Publié: (2026)

Fathom-DeepResearch: Unlocking Long Horizon Information Retrieval and Synthesis for SLMs
par: Singh, Shreyas, et autres
Publié: (2025)

Anomaly Prediction: A Novel Approach with Explicit Delay and Horizon
par: You, Jiang, et autres
Publié: (2024)

Hierarchical Two-Stage Framework for Environment-Aware Long-Horizon Vessel Trajectory Prediction
par: Gnanavel, Ganeshaaraj, et autres
Publié: (2026)

RLVMR: Reinforcement Learning with Verifiable Meta-Reasoning Rewards for Robust Long-Horizon Agents
par: Zhang, Zijing, et autres
Publié: (2025)

TRIP-Bench: A Benchmark for Long-Horizon Interactive Agents in Real-World Scenarios
par: Shen, Yuanzhe, et autres
Publié: (2026)

Generalization and Membership Inference Attack a Practical Perspective
par: Rahmani, Fateme, et autres
Publié: (2026)

ICA: Information-Aware Credit Assignment for Visually Grounded Long-Horizon Information-Seeking Agents
par: Pang, Cong, et autres
Publié: (2026)

SkillTree: Explainable Skill-Based Deep Reinforcement Learning for Long-Horizon Control Tasks
par: Wen, Yongyan, et autres
Publié: (2024)

HINT-SD: Targeted Hindsight Self-Distillation for Long-Horizon Agents
par: Yeo, Woongyeng, et autres
Publié: (2026)

A Subgoal-driven Framework for Improving Long-Horizon LLM Agents
par: Wang, Taiyi, et autres
Publié: (2026)

LongCoT: Benchmarking Long-Horizon Chain-of-Thought Reasoning
par: Motwani, Sumeet Ramesh, et autres
Publié: (2026)

Implicit Strategic Optimization: Rethinking Long-Horizon Decision-Making in Adversarial Poker Environments
par: Xia, Boyang, et autres
Publié: (2026)

On Training Large Language Models for Long-Horizon Tasks: An Empirical Study of Horizon Length
par: Kim, Sunghwan, et autres
Publié: (2026)

Intrinsic Credit Assignment for Long Horizon Interaction
par: Auzina, Ilze Amanda, et autres
Publié: (2026)

Sensi: Learn One Thing at a Time -- Curriculum-Based Test-Time Learning for LLM Game Agents
par: Arjmandi, Mohsen
Publié: (2026)

Can We Rely on LLM Agents to Draft Long-Horizon Plans? Let's Take TravelPlanner as an Example
par: Chen, Yanan, et autres
Publié: (2024)

Learning Multi-Agent Loco-Manipulation for Long-Horizon Quadrupedal Pushing
par: Feng, Yuming, et autres
Publié: (2024)

2048: Reinforcement Learning in a Delayed Reward Environment
par: Saligram, Prady, et autres
Publié: (2025)

ColorGrid: A Multi-Agent Non-Stationary Environment for Goal Inference and Assistance
par: Risukhin, Andrey, et autres
Publié: (2025)

Complex-Valued Unitary Representations as Classification Heads for Improved Uncertainty Quantification in Deep Neural Networks
par: Jafari, Akbar Anbar, et autres
Publié: (2026)

The Oversight Game: Learning to Cooperatively Balance an AI Agent's Safety and Autonomy
par: Overman, William, et autres
Publié: (2025)

MTSQL-R1: Towards Long-Horizon Multi-Turn Text-to-SQL via Agentic Training
par: Guo, Taicheng, et autres
Publié: (2025)

Solving the Granularity Mismatch: Hierarchical Preference Learning for Long-Horizon LLM Agents
par: Gao, Heyang, et autres
Publié: (2025)

AMA-Bench: Evaluating Long-Horizon Memory for Agentic Applications
par: Zhao, Yujie, et autres
Publié: (2026)

Hierarchy-of-Groups Policy Optimization for Long-Horizon Agentic Tasks
par: He, Shuo, et autres
Publié: (2026)

Impatient Bandits: Optimizing for the Long-Term Without Delay
par: Zhang, Kelly W., et autres
Publié: (2025)

AgentGym-RL: Training LLM Agents for Long-Horizon Decision Making through Multi-Turn Reinforcement Learning
par: Xi, Zhiheng, et autres
Publié: (2025)

Compressing Deep Neural Networks Using Explainable AI
par: Soroush, Kimia, et autres
Publié: (2025)

Refining Compositional Diffusion for Reliable Long-Horizon Planning
par: Lee, Kyowoon, et autres
Publié: (2026)

Proactive Agent Research Environment: Simulating Active Users to Evaluate Proactive Assistants
par: Nathani, Deepak, et autres
Publié: (2026)

Learning for Long-Horizon Planning via Neuro-Symbolic Abductive Imitation
par: Shao, Jie-Jing, et autres
Publié: (2024)