:: Library Catalog

Image de couverture de livre

Enregistré dans:

Détails bibliographiques
Auteurs principaux:	Li, Ang, Gong, Xinyang, Chen, Bozhou, Lu, Yunlong, Ji, Jiaming, Wang, Yongyi, Yang, Yaodong, Li, Wenxin
Format:	Preprint
Publié:	2026
Sujets:	Artificial Intelligence Machine Learning
Accès en ligne:	https://arxiv.org/abs/2603.17324
Tags:	Ajouter un tag Pas de tags, Soyez le premier à ajouter un tag!

Documents similaires

Synthetic POMDPs to Challenge Memory-Augmented RL: Memory Demand Structure Modeling
par: Wang, Yongyi, et autres
Publié: (2025)

Decoupling Return-to-Go for Efficient Decision Transformer
par: Wang, Yongyi, et autres
Publié: (2026)

Beyond Autoregressive RTG: Conditioning via Injection Outside Sequential Modeling in Decision Transformer
par: Wang, Yongyi, et autres
Publié: (2026)

Style-Preserving Policy Optimization for Game Agents
par: Li, Lingfeng, et autres
Publié: (2025)

Mxplainer: Explain and Learn Insights by Imitating Mahjong Agents
par: Li, Lingfeng, et autres
Publié: (2025)

Pareto-guided Pipeline for Distilling Featherweight AI Agents in Mobile MOBA Games
par: Yang, Xionghui, et autres
Publié: (2026)

One-Shot Badminton Shuttle Detection for Mobile Robots
par: Dipner, Florentin, et autres
Publié: (2026)

SortingEnv: An Extendable RL-Environment for an Industrial Sorting Process
par: Maus, Tom, et autres
Publié: (2025)

SAE-V: Interpreting Multimodal Models for Enhanced Alignment
par: Lou, Hantao, et autres
Publié: (2025)

Constructing Non-Markovian Decision Process via History Aggregator
par: Wang, Yongyi, et autres
Publié: (2025)

EnvFactory: Scaling Tool-Use Agents via Executable Environments Synthesis and Robust RL
par: Xu, Minrui, et autres
Publié: (2026)

LogicEnvGen: Task-Logic Driven Generation of Diverse Simulated Environments for Embodied AI
par: Wang, Jianan, et autres
Publié: (2026)

EnvScaler: Scaling Tool-Interactive Environments for LLM Agent via Programmatic Synthesis
par: Song, Xiaoshuai, et autres
Publié: (2026)

Sequence to Sequence Reward Modeling: Improving RLHF by Language Feedback
par: Zhou, Jiayi, et autres
Publié: (2024)

ClinEnv: An Interactive Multi-Stage Long Horizon EHR Environment for Agents
par: Lu, Yuxing, et autres
Publié: (2026)

Learning Human-Like Badminton Skills for Humanoid Robots
par: Chen, Yeke, et autres
Publié: (2026)

daVinci-Env: Open SWE Environment Synthesis at Scale
par: Fu, Dayuan, et autres
Publié: (2026)

EnvGS: Modeling View-Dependent Appearance with Environment Gaussian
par: Xie, Tao, et autres
Publié: (2024)

ResearchEnvBench: Benchmarking Agents on Environment Synthesis for Research Code Execution
par: Wang, Yubang, et autres
Publié: (2026)

ClawEnvKit: Automatic Environment Generation for Claw-Like Agents
par: Li, Xirui, et autres
Publié: (2026)

Adapting Rules of Official International Mahjong for Online Players
par: Wang, Chucai, et autres
Publié: (2026)

ScaleEnv: Scaling Environment Synthesis from Scratch for Generalist Interactive Tool-Use Agent Training
par: Tu, Dunwei, et autres
Publié: (2026)

Stream Aligner: Efficient Sentence-Level Alignment via Distribution Induction
par: Lou, Hantao, et autres
Publié: (2025)

DataEnvGym: Data Generation Agents in Teacher Environments with Student Feedback
par: Khan, Zaid, et autres
Publié: (2024)

SPADE-Bench: Evaluating Spontaneous Strategic Deception in Agents via Plan-Action Divergence
par: Bu, Yuyan, et autres
Publié: (2026)

SafeDreamer: Safe Reinforcement Learning with World Models
par: Huang, Weidong, et autres
Publié: (2023)

AutoEnv: Automated Environments for Measuring Cross-Environment Agent Learning
par: Zhang, Jiayi, et autres
Publié: (2025)

World-Env: Leveraging World Model as a Virtual Environment for VLA Post-Training
par: Xiao, Junjin, et autres
Publié: (2025)

ID-Align: RoPE-Conscious Position Remapping for Dynamic High-Resolution Adaptation in Vision-Language Models
par: Li, Bozhou, et autres
Publié: (2025)

Mobile-Env: Building Qualified Evaluation Benchmarks for LLM-GUI Interaction
par: Zhang, Danyang, et autres
Publié: (2023)

TrEnv-X: Transparently Share Serverless Execution Environments Across Different Functions and Nodes
par: Huang, Jialiang, et autres
Publié: (2025)

RedVLA: Physical Red Teaming for Vision-Language-Action Models
par: Zhang, Yuhao, et autres
Publié: (2026)

BotzoneBench: Scalable LLM Evaluation via Graded AI Anchors
par: Li, Lingfeng, et autres
Publié: (2026)

CoEnv: Driving Embodied Multi-Agent Collaboration via Compositional Environment
par: Kang, Li, et autres
Publié: (2026)

BadmintonGRF: A Multimodal Dataset and Benchmark for Markerless Ground Reaction Force Estimation in Badminton
par: Niu, Kuoye, et autres
Publié: (2026)

Language Models Resist Alignment: Evidence From Data Compression
par: Ji, Jiaming, et autres
Publié: (2024)

The EnvDesign Model: A Method to Solve the Environment Design Problem
par: Sathiya, Akshay, et autres
Publié: (2024)

EnvBench: A Benchmark for Automated Environment Setup
par: Eliseeva, Aleksandra, et autres
Publié: (2025)

SafeMCP: Proactive Power Regulation for LLM Agent Defense via Environment-Grounded Look-Ahead Reasoning
par: Wang, Lichao, et autres
Publié: (2026)

EnvBridge: Bridging Diverse Environments with Cross-Environment Knowledge Transfer for Embodied AI
par: Kagaya, Tomoyuki, et autres
Publié: (2024)