:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autori principali:	Wang, Fan, Shao, Pengtao, Zhang, Yiming, Yu, Bo, Liu, Shaoshan, Ding, Ning, Cao, Yang, Kang, Yu, Wang, Haifeng
Natura:	Preprint
Pubblicazione:	2025
Soggetti:	Machine Learning Artificial Intelligence
Accesso online:	https://arxiv.org/abs/2502.02869
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

Context and Diversity Matter: The Emergence of In-Context Learning in World Models
di: Wang, Fan, et al.
Pubblicazione: (2025)

StateLinFormer: Stateful Training Enhancing Long-term Memory in Navigation
di: Chen, Zhiyuan, et al.
Pubblicazione: (2026)

In-Context Learning can Perform Continual Learning Like Humans
di: Kang, Liuwang, et al.
Pubblicazione: (2025)

Conceptual Framework Toward Embodied Collective Adaptive Intelligence
di: Wang, Fan, et al.
Pubblicazione: (2025)

VAP: The Vulnerability-Adaptive Protection Paradigm Toward Reliable Autonomous Machines
di: Wan, Zishen, et al.
Pubblicazione: (2024)

Benchmarking General-Purpose In-Context Learning
di: Wang, Fan, et al.
Pubblicazione: (2024)

Training Cross-Morphology Embodied AI Agents: From Practical Challenges to Theoretical Foundations
di: Liu, Shaoshan, et al.
Pubblicazione: (2025)

Dadu‐E : Rethinking the Role of Large Language Model in Robotic Computing Pipelines
di: Wenhao Sun, et al.
Pubblicazione: (2025)

DaDu-E: Rethinking the Role of Large Language Model in Robotic Computing Pipeline
di: Sun, Wenhao, et al.
Pubblicazione: (2024)

Thales: Formulating and Estimating Architectural Vulnerability Factors for DNN Accelerators
di: Tyagi, Abhishek, et al.
Pubblicazione: (2022)

Towards Monotonic Improvement in In-Context Reinforcement Learning
di: Zhang, Wenhao, et al.
Pubblicazione: (2025)

EfficientNav: Towards On-Device Object-Goal Navigation with Navigation Map Caching and Retrieval
di: Yang, Zebin, et al.
Pubblicazione: (2025)

DuMapper: Towards Automatic Verification of Large-Scale POIs with Street Views at Baidu Maps
di: Fan, Miao, et al.
Pubblicazione: (2024)

A Theoretical Understanding of Gradient Bias in Meta-Reinforcement Learning
di: Feng, Xidong, et al.
Pubblicazione: (2021)

SimpleVLA-RL: Scaling VLA Training via Reinforcement Learning
di: Li, Haozhan, et al.
Pubblicazione: (2025)

Towards an Information Theoretic Framework of Context-Based Offline Meta-Reinforcement Learning
di: Li, Lanqing, et al.
Pubblicazione: (2024)

ATLAS: Agentic Test-time Learning-to-Allocate Scaling
di: Qin, Peijia, et al.
Pubblicazione: (2026)

The Biggest Risk of Embodied AI is Governance Lag
di: Liu, Shaoshan
Pubblicazione: (2026)

Large‐Scale Multi‐Objective Optimization Algorithms: A Decade Survey
di: Pengtao Wang, et al.
Pubblicazione: (2025)

DreamPRM-1.5: Unlocking the Potential of Each Instance for Multimodal Process Reward Model Training
di: Cao, Qi, et al.
Pubblicazione: (2025)

Several functional capacities and Carleson type embeddings of fractional Sobolev sapces on stratified Lie groups
di: Wang, Zhiyong, et al.
Pubblicazione: (2024)

WebWorld: A Large-Scale World Model for Web Agent Training
di: Xiao, Zikai, et al.
Pubblicazione: (2026)

KEEP: A KV-Cache-Centric Memory Management System for Efficient Embodied Planning
di: Yang, Zebin, et al.
Pubblicazione: (2026)

DySL-VLA: Efficient Vision-Language-Action Model Inference via Dynamic-Static Layer-Skipping for Robot Manipulation
di: Yang, Zebin, et al.
Pubblicazione: (2026)

Curious Causality-Seeking Agents Learn Meta Causal World
di: Zhao, Zhiyu, et al.
Pubblicazione: (2025)

Vulnerable Agent Identification in Large-Scale Multi-Agent Reinforcement Learning
di: Li, Simin, et al.
Pubblicazione: (2025)

Relax: An Asynchronous Reinforcement Learning Engine for Omni-Modal Post-Training at Scale
di: Zhang, Liujie, et al.
Pubblicazione: (2026)

LoongRL: Reinforcement Learning for Advanced Reasoning over Long Contexts
di: Wang, Siyuan, et al.
Pubblicazione: (2025)

MGM as a Large‐Scale Pretrained Foundation Model for Microbiome Analyses in Diverse Contexts
di: Haohong Zhang, et al.
Pubblicazione: (2026)

MicLog: Towards Accurate and Efficient LLM-based Log Parsing via Progressive Meta In-Context Learning
di: Yu, Jianbo, et al.
Pubblicazione: (2026)

Jailbreaking Large Language Models through Iterative Tool-Disguised Attacks via Reinforcement Learning
di: Wang, Zhaoqi, et al.
Pubblicazione: (2026)

Boosting the Generalization and Reasoning of Vision Language Models with Curriculum Reinforcement Learning
di: Deng, Huilin, et al.
Pubblicazione: (2025)

Reinforcement Learning Optimization for Large-Scale Learning: An Efficient and User-Friendly Scaling Library
di: Wang, Weixun, et al.
Pubblicazione: (2025)

Meta-Inverse Reinforcement Learning for Mean Field Games via Probabilistic Context Variables
di: Chen, Yang, et al.
Pubblicazione: (2025)

Collaborative Computing in Non-Terrestrial Networks: A Multi-Time-Scale Deep Reinforcement Learning Approach
di: Cao, Yang, et al.
Pubblicazione: (2024)

Task-Stratified Knowledge Scaling Laws for Post-Training Quantized Large Language Models
di: Zhou, Chenxi, et al.
Pubblicazione: (2025)

Global Convergence in Training Large-Scale Transformers
di: Gao, Cheng, et al.
Pubblicazione: (2024)

The magnetic $Z_2$ topological insulator on the AA-stacked bilayer graphene
di: Liu, Yu-Bo, et al.
Pubblicazione: (2024)

Unconventional superfluidity of superconductivity on Penrose lattice
di: Liu, Yu-Bo, et al.
Pubblicazione: (2023)

Improving the Language Understanding Capabilities of Large Language Models Using Reinforcement Learning
di: Hu, Bokai, et al.
Pubblicazione: (2024)