Enregistré dans:
| Auteurs principaux: | Park, Joonha, Jeong, Jiseung, Gong, Taesik |
|---|---|
| Format: | Preprint |
| Publié: |
2026
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2605.12160 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
FineVLA: Fine-Grained Instruction Alignment for Steerable Vision-Language-Action Policies
par: Hu, Xintong, et autres
Publié: (2026)
par: Hu, Xintong, et autres
Publié: (2026)
ActionFlow: A Pipelined Action Acceleration for Vision Language Models on Edge
par: Dai, Yuntao, et autres
Publié: (2025)
par: Dai, Yuntao, et autres
Publié: (2025)
BUMBLE: Unifying Reasoning and Acting with Vision-Language Models for Building-wide Mobile Manipulation
par: Shah, Rutav, et autres
Publié: (2024)
par: Shah, Rutav, et autres
Publié: (2024)
Hierarchical Vision Language Action Model Using Success and Failure Demonstrations
par: Park, Jeongeun, et autres
Publié: (2025)
par: Park, Jeongeun, et autres
Publié: (2025)
Asynchronous Fast-Slow Vision-Language-Action Policies for Whole-Body Robotic Manipulation
par: Zou, Teqiang, et autres
Publié: (2025)
par: Zou, Teqiang, et autres
Publié: (2025)
KineVLA: Towards Kinematics-Aware Vision-Language-Action Models with Bi-Level Action Decomposition
par: Han, Gaoge, et autres
Publié: (2026)
par: Han, Gaoge, et autres
Publié: (2026)
Action Hallucination in Generative Vision-Language-Action Models
par: Soh, Harold, et autres
Publié: (2026)
par: Soh, Harold, et autres
Publié: (2026)
LeVERB: Humanoid Whole-Body Control with Latent Vision-Language Instruction
par: Xue, Haoru, et autres
Publié: (2025)
par: Xue, Haoru, et autres
Publié: (2025)
Hi Robot: Open-Ended Instruction Following with Hierarchical Vision-Language-Action Models
par: Shi, Lucy Xiaoyang, et autres
Publié: (2025)
par: Shi, Lucy Xiaoyang, et autres
Publié: (2025)
Action-aware Dynamic Pruning for Efficient Vision-Language-Action Manipulation
par: Pei, Xiaohuan, et autres
Publié: (2025)
par: Pei, Xiaohuan, et autres
Publié: (2025)
ReconVLA: An Uncertainty-Guided and Failure-Aware Vision-Language-Action Framework for Robotic Control
par: Chen, Lingling, et autres
Publié: (2026)
par: Chen, Lingling, et autres
Publié: (2026)
AR-VLA: True Autoregressive Action Expert for Vision-Language-Action Models
par: Hu, Yutong, et autres
Publié: (2026)
par: Hu, Yutong, et autres
Publié: (2026)
Adversarial Attacks on Robotic Vision Language Action Models
par: Jones, Eliot Krzysztof, et autres
Publié: (2025)
par: Jones, Eliot Krzysztof, et autres
Publié: (2025)
Survey of Vision-Language-Action Models for Embodied Manipulation
par: Li, Haoran, et autres
Publié: (2025)
par: Li, Haoran, et autres
Publié: (2025)
Information-Theoretic Graph Fusion with Vision-Language-Action Model for Policy Reasoning and Dual Robotic Control
par: Li, Shunlei, et autres
Publié: (2025)
par: Li, Shunlei, et autres
Publié: (2025)
Expertise need not monopolize: Action-Specialized Mixture of Experts for Vision-Language-Action Learning
par: Shen, Weijie, et autres
Publié: (2025)
par: Shen, Weijie, et autres
Publié: (2025)
ALOE: Action-Level Off-Policy Evaluation for Vision-Language-Action Model Post-Training
par: Yang, Rushuai, et autres
Publié: (2026)
par: Yang, Rushuai, et autres
Publié: (2026)
Adaptive Capacity Allocation for Vision Language Action Fine-tuning
par: Kim, Donghoon, et autres
Publié: (2026)
par: Kim, Donghoon, et autres
Publié: (2026)
Event-Grounded Sparse Autoencoders for Vision-Language-Action Policies
par: Jin, Xinchen, et autres
Publié: (2026)
par: Jin, Xinchen, et autres
Publié: (2026)
Mean-Flow based One-Step Vision-Language-Action
par: Chen, Yang, et autres
Publié: (2026)
par: Chen, Yang, et autres
Publié: (2026)
Exploring the Adversarial Vulnerabilities of Vision-Language-Action Models in Robotics
par: Wang, Taowen, et autres
Publié: (2024)
par: Wang, Taowen, et autres
Publié: (2024)
Developing Vision-Language-Action Model from Egocentric Videos
par: Yoshida, Tomoya, et autres
Publié: (2025)
par: Yoshida, Tomoya, et autres
Publié: (2025)
Emergence of Human to Robot Transfer in Vision-Language-Action Models
par: Kareer, Simar, et autres
Publié: (2025)
par: Kareer, Simar, et autres
Publié: (2025)
SAFE: Multitask Failure Detection for Vision-Language-Action Models
par: Gu, Qiao, et autres
Publié: (2025)
par: Gu, Qiao, et autres
Publié: (2025)
Continually Evolving Skill Knowledge in Vision Language Action Model
par: Wu, Yuxuan, et autres
Publié: (2025)
par: Wu, Yuxuan, et autres
Publié: (2025)
Continuous Reasoning for Vision-Language-Action
par: Wu, Yueh-Hua, et autres
Publié: (2026)
par: Wu, Yueh-Hua, et autres
Publié: (2026)
D-VLA: A High-Concurrency Distributed Asynchronous Reinforcement Learning Framework for Vision-Language-Action Models
par: Guo, Yucheng, et autres
Publié: (2026)
par: Guo, Yucheng, et autres
Publié: (2026)
V-VLAPS: Value-Guided Planning for Vision-Language-Action Models
par: Ren, Ke, et autres
Publié: (2026)
par: Ren, Ke, et autres
Publié: (2026)
Towards Backdoor-Based Ownership Verification for Vision-Language-Action Models
par: Sun, Ming, et autres
Publié: (2026)
par: Sun, Ming, et autres
Publié: (2026)
Experiences from Benchmarking Vision-Language-Action Models for Robotic Manipulation
par: Zhang, Yihao, et autres
Publié: (2025)
par: Zhang, Yihao, et autres
Publié: (2025)
10 Open Challenges Steering the Future of Vision-Language-Action Models
par: Poria, Soujanya, et autres
Publié: (2025)
par: Poria, Soujanya, et autres
Publié: (2025)
Pure Vision Language Action (VLA) Models: A Comprehensive Survey
par: Zhang, Dapeng, et autres
Publié: (2025)
par: Zhang, Dapeng, et autres
Publié: (2025)
Do What? Teaching Vision-Language-Action Models to Reject the Impossible
par: Hsieh, Wen-Han, et autres
Publié: (2025)
par: Hsieh, Wen-Han, et autres
Publié: (2025)
Explainable Adversarial-Robust Vision-Language-Action Model for Robotic Manipulation
par: Kim, Ju-Young, et autres
Publié: (2025)
par: Kim, Ju-Young, et autres
Publié: (2025)
Causal Scene Narration with Runtime Safety Supervision for Vision-Language-Action Driving
par: Li, Yun, et autres
Publié: (2026)
par: Li, Yun, et autres
Publié: (2026)
Vision-Language-Action in Robotics: A Survey of Datasets, Benchmarks, and Data Engines
par: Wang, Ziyao, et autres
Publié: (2026)
par: Wang, Ziyao, et autres
Publié: (2026)
RLRC: Reinforcement Learning-based Recovery for Compressed Vision-Language-Action Models
par: Chen, Yuxuan, et autres
Publié: (2025)
par: Chen, Yuxuan, et autres
Publié: (2025)
WMPO: World Model-based Policy Optimization for Vision-Language-Action Models
par: Zhu, Fangqi, et autres
Publié: (2025)
par: Zhu, Fangqi, et autres
Publié: (2025)
Improving Pre-Trained Vision-Language-Action Policies with Model-Based Search
par: Neary, Cyrus, et autres
Publié: (2025)
par: Neary, Cyrus, et autres
Publié: (2025)
RICL: Adding In-Context Adaptability to Pre-Trained Vision-Language-Action Models
par: Sridhar, Kaustubh, et autres
Publié: (2025)
par: Sridhar, Kaustubh, et autres
Publié: (2025)
Documents similaires
-
FineVLA: Fine-Grained Instruction Alignment for Steerable Vision-Language-Action Policies
par: Hu, Xintong, et autres
Publié: (2026) -
ActionFlow: A Pipelined Action Acceleration for Vision Language Models on Edge
par: Dai, Yuntao, et autres
Publié: (2025) -
BUMBLE: Unifying Reasoning and Acting with Vision-Language Models for Building-wide Mobile Manipulation
par: Shah, Rutav, et autres
Publié: (2024) -
Hierarchical Vision Language Action Model Using Success and Failure Demonstrations
par: Park, Jeongeun, et autres
Publié: (2025) -
Asynchronous Fast-Slow Vision-Language-Action Policies for Whole-Body Robotic Manipulation
par: Zou, Teqiang, et autres
Publié: (2025)