Salvato in:
| Autori principali: | Wang, Fan, Shao, Pengtao, Zhang, Yiming, Yu, Bo, Liu, Shaoshan, Ding, Ning, Cao, Yang, Kang, Yu, Wang, Haifeng |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2025
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2502.02869 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
Context and Diversity Matter: The Emergence of In-Context Learning in World Models
di: Wang, Fan, et al.
Pubblicazione: (2025)
di: Wang, Fan, et al.
Pubblicazione: (2025)
StateLinFormer: Stateful Training Enhancing Long-term Memory in Navigation
di: Chen, Zhiyuan, et al.
Pubblicazione: (2026)
di: Chen, Zhiyuan, et al.
Pubblicazione: (2026)
In-Context Learning can Perform Continual Learning Like Humans
di: Kang, Liuwang, et al.
Pubblicazione: (2025)
di: Kang, Liuwang, et al.
Pubblicazione: (2025)
Conceptual Framework Toward Embodied Collective Adaptive Intelligence
di: Wang, Fan, et al.
Pubblicazione: (2025)
di: Wang, Fan, et al.
Pubblicazione: (2025)
VAP: The Vulnerability-Adaptive Protection Paradigm Toward Reliable Autonomous Machines
di: Wan, Zishen, et al.
Pubblicazione: (2024)
di: Wan, Zishen, et al.
Pubblicazione: (2024)
Benchmarking General-Purpose In-Context Learning
di: Wang, Fan, et al.
Pubblicazione: (2024)
di: Wang, Fan, et al.
Pubblicazione: (2024)
Training Cross-Morphology Embodied AI Agents: From Practical Challenges to Theoretical Foundations
di: Liu, Shaoshan, et al.
Pubblicazione: (2025)
di: Liu, Shaoshan, et al.
Pubblicazione: (2025)
Dadu‐E : Rethinking the Role of Large Language Model in Robotic Computing Pipelines
di: Wenhao Sun, et al.
Pubblicazione: (2025)
di: Wenhao Sun, et al.
Pubblicazione: (2025)
DaDu-E: Rethinking the Role of Large Language Model in Robotic Computing Pipeline
di: Sun, Wenhao, et al.
Pubblicazione: (2024)
di: Sun, Wenhao, et al.
Pubblicazione: (2024)
Thales: Formulating and Estimating Architectural Vulnerability Factors for DNN Accelerators
di: Tyagi, Abhishek, et al.
Pubblicazione: (2022)
di: Tyagi, Abhishek, et al.
Pubblicazione: (2022)
Towards Monotonic Improvement in In-Context Reinforcement Learning
di: Zhang, Wenhao, et al.
Pubblicazione: (2025)
di: Zhang, Wenhao, et al.
Pubblicazione: (2025)
EfficientNav: Towards On-Device Object-Goal Navigation with Navigation Map Caching and Retrieval
di: Yang, Zebin, et al.
Pubblicazione: (2025)
di: Yang, Zebin, et al.
Pubblicazione: (2025)
DuMapper: Towards Automatic Verification of Large-Scale POIs with Street Views at Baidu Maps
di: Fan, Miao, et al.
Pubblicazione: (2024)
di: Fan, Miao, et al.
Pubblicazione: (2024)
A Theoretical Understanding of Gradient Bias in Meta-Reinforcement Learning
di: Feng, Xidong, et al.
Pubblicazione: (2021)
di: Feng, Xidong, et al.
Pubblicazione: (2021)
SimpleVLA-RL: Scaling VLA Training via Reinforcement Learning
di: Li, Haozhan, et al.
Pubblicazione: (2025)
di: Li, Haozhan, et al.
Pubblicazione: (2025)
Towards an Information Theoretic Framework of Context-Based Offline Meta-Reinforcement Learning
di: Li, Lanqing, et al.
Pubblicazione: (2024)
di: Li, Lanqing, et al.
Pubblicazione: (2024)
ATLAS: Agentic Test-time Learning-to-Allocate Scaling
di: Qin, Peijia, et al.
Pubblicazione: (2026)
di: Qin, Peijia, et al.
Pubblicazione: (2026)
The Biggest Risk of Embodied AI is Governance Lag
di: Liu, Shaoshan
Pubblicazione: (2026)
di: Liu, Shaoshan
Pubblicazione: (2026)
Large‐Scale Multi‐Objective Optimization Algorithms: A Decade Survey
di: Pengtao Wang, et al.
Pubblicazione: (2025)
di: Pengtao Wang, et al.
Pubblicazione: (2025)
DreamPRM-1.5: Unlocking the Potential of Each Instance for Multimodal Process Reward Model Training
di: Cao, Qi, et al.
Pubblicazione: (2025)
di: Cao, Qi, et al.
Pubblicazione: (2025)
Several functional capacities and Carleson type embeddings of fractional Sobolev sapces on stratified Lie groups
di: Wang, Zhiyong, et al.
Pubblicazione: (2024)
di: Wang, Zhiyong, et al.
Pubblicazione: (2024)
WebWorld: A Large-Scale World Model for Web Agent Training
di: Xiao, Zikai, et al.
Pubblicazione: (2026)
di: Xiao, Zikai, et al.
Pubblicazione: (2026)
KEEP: A KV-Cache-Centric Memory Management System for Efficient Embodied Planning
di: Yang, Zebin, et al.
Pubblicazione: (2026)
di: Yang, Zebin, et al.
Pubblicazione: (2026)
DySL-VLA: Efficient Vision-Language-Action Model Inference via Dynamic-Static Layer-Skipping for Robot Manipulation
di: Yang, Zebin, et al.
Pubblicazione: (2026)
di: Yang, Zebin, et al.
Pubblicazione: (2026)
Curious Causality-Seeking Agents Learn Meta Causal World
di: Zhao, Zhiyu, et al.
Pubblicazione: (2025)
di: Zhao, Zhiyu, et al.
Pubblicazione: (2025)
Vulnerable Agent Identification in Large-Scale Multi-Agent Reinforcement Learning
di: Li, Simin, et al.
Pubblicazione: (2025)
di: Li, Simin, et al.
Pubblicazione: (2025)
Relax: An Asynchronous Reinforcement Learning Engine for Omni-Modal Post-Training at Scale
di: Zhang, Liujie, et al.
Pubblicazione: (2026)
di: Zhang, Liujie, et al.
Pubblicazione: (2026)
LoongRL: Reinforcement Learning for Advanced Reasoning over Long Contexts
di: Wang, Siyuan, et al.
Pubblicazione: (2025)
di: Wang, Siyuan, et al.
Pubblicazione: (2025)
MGM as a Large‐Scale Pretrained Foundation Model for Microbiome Analyses in Diverse Contexts
di: Haohong Zhang, et al.
Pubblicazione: (2026)
di: Haohong Zhang, et al.
Pubblicazione: (2026)
MicLog: Towards Accurate and Efficient LLM-based Log Parsing via Progressive Meta In-Context Learning
di: Yu, Jianbo, et al.
Pubblicazione: (2026)
di: Yu, Jianbo, et al.
Pubblicazione: (2026)
Jailbreaking Large Language Models through Iterative Tool-Disguised Attacks via Reinforcement Learning
di: Wang, Zhaoqi, et al.
Pubblicazione: (2026)
di: Wang, Zhaoqi, et al.
Pubblicazione: (2026)
Boosting the Generalization and Reasoning of Vision Language Models with Curriculum Reinforcement Learning
di: Deng, Huilin, et al.
Pubblicazione: (2025)
di: Deng, Huilin, et al.
Pubblicazione: (2025)
Reinforcement Learning Optimization for Large-Scale Learning: An Efficient and User-Friendly Scaling Library
di: Wang, Weixun, et al.
Pubblicazione: (2025)
di: Wang, Weixun, et al.
Pubblicazione: (2025)
Meta-Inverse Reinforcement Learning for Mean Field Games via Probabilistic Context Variables
di: Chen, Yang, et al.
Pubblicazione: (2025)
di: Chen, Yang, et al.
Pubblicazione: (2025)
Collaborative Computing in Non-Terrestrial Networks: A Multi-Time-Scale Deep Reinforcement Learning Approach
di: Cao, Yang, et al.
Pubblicazione: (2024)
di: Cao, Yang, et al.
Pubblicazione: (2024)
Task-Stratified Knowledge Scaling Laws for Post-Training Quantized Large Language Models
di: Zhou, Chenxi, et al.
Pubblicazione: (2025)
di: Zhou, Chenxi, et al.
Pubblicazione: (2025)
Global Convergence in Training Large-Scale Transformers
di: Gao, Cheng, et al.
Pubblicazione: (2024)
di: Gao, Cheng, et al.
Pubblicazione: (2024)
The magnetic $Z_2$ topological insulator on the AA-stacked bilayer graphene
di: Liu, Yu-Bo, et al.
Pubblicazione: (2024)
di: Liu, Yu-Bo, et al.
Pubblicazione: (2024)
Unconventional superfluidity of superconductivity on Penrose lattice
di: Liu, Yu-Bo, et al.
Pubblicazione: (2023)
di: Liu, Yu-Bo, et al.
Pubblicazione: (2023)
Improving the Language Understanding Capabilities of Large Language Models Using Reinforcement Learning
di: Hu, Bokai, et al.
Pubblicazione: (2024)
di: Hu, Bokai, et al.
Pubblicazione: (2024)
Documenti analoghi
-
Context and Diversity Matter: The Emergence of In-Context Learning in World Models
di: Wang, Fan, et al.
Pubblicazione: (2025) -
StateLinFormer: Stateful Training Enhancing Long-term Memory in Navigation
di: Chen, Zhiyuan, et al.
Pubblicazione: (2026) -
In-Context Learning can Perform Continual Learning Like Humans
di: Kang, Liuwang, et al.
Pubblicazione: (2025) -
Conceptual Framework Toward Embodied Collective Adaptive Intelligence
di: Wang, Fan, et al.
Pubblicazione: (2025) -
VAP: The Vulnerability-Adaptive Protection Paradigm Toward Reliable Autonomous Machines
di: Wan, Zishen, et al.
Pubblicazione: (2024)