Enregistré dans:
| Auteurs principaux: | Li, Ang, Gong, Xinyang, Chen, Bozhou, Lu, Yunlong, Ji, Jiaming, Wang, Yongyi, Yang, Yaodong, Li, Wenxin |
|---|---|
| Format: | Preprint |
| Publié: |
2026
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2603.17324 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
Synthetic POMDPs to Challenge Memory-Augmented RL: Memory Demand Structure Modeling
par: Wang, Yongyi, et autres
Publié: (2025)
par: Wang, Yongyi, et autres
Publié: (2025)
Decoupling Return-to-Go for Efficient Decision Transformer
par: Wang, Yongyi, et autres
Publié: (2026)
par: Wang, Yongyi, et autres
Publié: (2026)
Beyond Autoregressive RTG: Conditioning via Injection Outside Sequential Modeling in Decision Transformer
par: Wang, Yongyi, et autres
Publié: (2026)
par: Wang, Yongyi, et autres
Publié: (2026)
Style-Preserving Policy Optimization for Game Agents
par: Li, Lingfeng, et autres
Publié: (2025)
par: Li, Lingfeng, et autres
Publié: (2025)
Mxplainer: Explain and Learn Insights by Imitating Mahjong Agents
par: Li, Lingfeng, et autres
Publié: (2025)
par: Li, Lingfeng, et autres
Publié: (2025)
Pareto-guided Pipeline for Distilling Featherweight AI Agents in Mobile MOBA Games
par: Yang, Xionghui, et autres
Publié: (2026)
par: Yang, Xionghui, et autres
Publié: (2026)
One-Shot Badminton Shuttle Detection for Mobile Robots
par: Dipner, Florentin, et autres
Publié: (2026)
par: Dipner, Florentin, et autres
Publié: (2026)
SortingEnv: An Extendable RL-Environment for an Industrial Sorting Process
par: Maus, Tom, et autres
Publié: (2025)
par: Maus, Tom, et autres
Publié: (2025)
SAE-V: Interpreting Multimodal Models for Enhanced Alignment
par: Lou, Hantao, et autres
Publié: (2025)
par: Lou, Hantao, et autres
Publié: (2025)
Constructing Non-Markovian Decision Process via History Aggregator
par: Wang, Yongyi, et autres
Publié: (2025)
par: Wang, Yongyi, et autres
Publié: (2025)
EnvFactory: Scaling Tool-Use Agents via Executable Environments Synthesis and Robust RL
par: Xu, Minrui, et autres
Publié: (2026)
par: Xu, Minrui, et autres
Publié: (2026)
LogicEnvGen: Task-Logic Driven Generation of Diverse Simulated Environments for Embodied AI
par: Wang, Jianan, et autres
Publié: (2026)
par: Wang, Jianan, et autres
Publié: (2026)
EnvScaler: Scaling Tool-Interactive Environments for LLM Agent via Programmatic Synthesis
par: Song, Xiaoshuai, et autres
Publié: (2026)
par: Song, Xiaoshuai, et autres
Publié: (2026)
Sequence to Sequence Reward Modeling: Improving RLHF by Language Feedback
par: Zhou, Jiayi, et autres
Publié: (2024)
par: Zhou, Jiayi, et autres
Publié: (2024)
ClinEnv: An Interactive Multi-Stage Long Horizon EHR Environment for Agents
par: Lu, Yuxing, et autres
Publié: (2026)
par: Lu, Yuxing, et autres
Publié: (2026)
Learning Human-Like Badminton Skills for Humanoid Robots
par: Chen, Yeke, et autres
Publié: (2026)
par: Chen, Yeke, et autres
Publié: (2026)
daVinci-Env: Open SWE Environment Synthesis at Scale
par: Fu, Dayuan, et autres
Publié: (2026)
par: Fu, Dayuan, et autres
Publié: (2026)
EnvGS: Modeling View-Dependent Appearance with Environment Gaussian
par: Xie, Tao, et autres
Publié: (2024)
par: Xie, Tao, et autres
Publié: (2024)
ResearchEnvBench: Benchmarking Agents on Environment Synthesis for Research Code Execution
par: Wang, Yubang, et autres
Publié: (2026)
par: Wang, Yubang, et autres
Publié: (2026)
ClawEnvKit: Automatic Environment Generation for Claw-Like Agents
par: Li, Xirui, et autres
Publié: (2026)
par: Li, Xirui, et autres
Publié: (2026)
Adapting Rules of Official International Mahjong for Online Players
par: Wang, Chucai, et autres
Publié: (2026)
par: Wang, Chucai, et autres
Publié: (2026)
ScaleEnv: Scaling Environment Synthesis from Scratch for Generalist Interactive Tool-Use Agent Training
par: Tu, Dunwei, et autres
Publié: (2026)
par: Tu, Dunwei, et autres
Publié: (2026)
Stream Aligner: Efficient Sentence-Level Alignment via Distribution Induction
par: Lou, Hantao, et autres
Publié: (2025)
par: Lou, Hantao, et autres
Publié: (2025)
DataEnvGym: Data Generation Agents in Teacher Environments with Student Feedback
par: Khan, Zaid, et autres
Publié: (2024)
par: Khan, Zaid, et autres
Publié: (2024)
SPADE-Bench: Evaluating Spontaneous Strategic Deception in Agents via Plan-Action Divergence
par: Bu, Yuyan, et autres
Publié: (2026)
par: Bu, Yuyan, et autres
Publié: (2026)
SafeDreamer: Safe Reinforcement Learning with World Models
par: Huang, Weidong, et autres
Publié: (2023)
par: Huang, Weidong, et autres
Publié: (2023)
AutoEnv: Automated Environments for Measuring Cross-Environment Agent Learning
par: Zhang, Jiayi, et autres
Publié: (2025)
par: Zhang, Jiayi, et autres
Publié: (2025)
World-Env: Leveraging World Model as a Virtual Environment for VLA Post-Training
par: Xiao, Junjin, et autres
Publié: (2025)
par: Xiao, Junjin, et autres
Publié: (2025)
ID-Align: RoPE-Conscious Position Remapping for Dynamic High-Resolution Adaptation in Vision-Language Models
par: Li, Bozhou, et autres
Publié: (2025)
par: Li, Bozhou, et autres
Publié: (2025)
Mobile-Env: Building Qualified Evaluation Benchmarks for LLM-GUI Interaction
par: Zhang, Danyang, et autres
Publié: (2023)
par: Zhang, Danyang, et autres
Publié: (2023)
TrEnv-X: Transparently Share Serverless Execution Environments Across Different Functions and Nodes
par: Huang, Jialiang, et autres
Publié: (2025)
par: Huang, Jialiang, et autres
Publié: (2025)
RedVLA: Physical Red Teaming for Vision-Language-Action Models
par: Zhang, Yuhao, et autres
Publié: (2026)
par: Zhang, Yuhao, et autres
Publié: (2026)
BotzoneBench: Scalable LLM Evaluation via Graded AI Anchors
par: Li, Lingfeng, et autres
Publié: (2026)
par: Li, Lingfeng, et autres
Publié: (2026)
CoEnv: Driving Embodied Multi-Agent Collaboration via Compositional Environment
par: Kang, Li, et autres
Publié: (2026)
par: Kang, Li, et autres
Publié: (2026)
BadmintonGRF: A Multimodal Dataset and Benchmark for Markerless Ground Reaction Force Estimation in Badminton
par: Niu, Kuoye, et autres
Publié: (2026)
par: Niu, Kuoye, et autres
Publié: (2026)
Language Models Resist Alignment: Evidence From Data Compression
par: Ji, Jiaming, et autres
Publié: (2024)
par: Ji, Jiaming, et autres
Publié: (2024)
The EnvDesign Model: A Method to Solve the Environment Design Problem
par: Sathiya, Akshay, et autres
Publié: (2024)
par: Sathiya, Akshay, et autres
Publié: (2024)
EnvBench: A Benchmark for Automated Environment Setup
par: Eliseeva, Aleksandra, et autres
Publié: (2025)
par: Eliseeva, Aleksandra, et autres
Publié: (2025)
SafeMCP: Proactive Power Regulation for LLM Agent Defense via Environment-Grounded Look-Ahead Reasoning
par: Wang, Lichao, et autres
Publié: (2026)
par: Wang, Lichao, et autres
Publié: (2026)
EnvBridge: Bridging Diverse Environments with Cross-Environment Knowledge Transfer for Embodied AI
par: Kagaya, Tomoyuki, et autres
Publié: (2024)
par: Kagaya, Tomoyuki, et autres
Publié: (2024)
Documents similaires
-
Synthetic POMDPs to Challenge Memory-Augmented RL: Memory Demand Structure Modeling
par: Wang, Yongyi, et autres
Publié: (2025) -
Decoupling Return-to-Go for Efficient Decision Transformer
par: Wang, Yongyi, et autres
Publié: (2026) -
Beyond Autoregressive RTG: Conditioning via Injection Outside Sequential Modeling in Decision Transformer
par: Wang, Yongyi, et autres
Publié: (2026) -
Style-Preserving Policy Optimization for Game Agents
par: Li, Lingfeng, et autres
Publié: (2025) -
Mxplainer: Explain and Learn Insights by Imitating Mahjong Agents
par: Li, Lingfeng, et autres
Publié: (2025)