Enregistré dans:
| Auteurs principaux: | Jia, Yueru, Liu, Jiaming, Chen, Sixiang, Gu, Chenyang, Wang, Zhilue, Luo, Longzan, Lee, Lily, Wang, Pengwei, Wang, Zhongyuan, Zhang, Renrui, Zhang, Shanghang |
|---|---|
| Format: | Preprint |
| Publié: |
2024
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2411.18623 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
AC-DiT: Adaptive Coordination Diffusion Transformer for Mobile Manipulation
par: Chen, Sixiang, et autres
Publié: (2025)
par: Chen, Sixiang, et autres
Publié: (2025)
Lift3D: Zero-Shot Lifting of Any 2D Vision Model to 3D
par: T, Mukund Varma, et autres
Publié: (2024)
par: T, Mukund Varma, et autres
Publié: (2024)
NTO3D: Neural Target Object 3D Reconstruction with Segment Anything
par: Wei, Xiaobao, et autres
Publié: (2023)
par: Wei, Xiaobao, et autres
Publié: (2023)
3D-LFM: Lifting Foundation Model
par: Dabhi, Mosam, et autres
Publié: (2023)
par: Dabhi, Mosam, et autres
Publié: (2023)
PLGS: Robust Panoptic Lifting with 3D Gaussian Splatting
par: Wang, Yu, et autres
Publié: (2024)
par: Wang, Yu, et autres
Publié: (2024)
RenderOcc: Vision-Centric 3D Occupancy Prediction with 2D Rendering Supervision
par: Pan, Mingjie, et autres
Publié: (2023)
par: Pan, Mingjie, et autres
Publié: (2023)
LAMP: Lift Image-Editing as General 3D Priors for Open-world Manipulation
par: Wang, Jingjing, et autres
Publié: (2026)
par: Wang, Jingjing, et autres
Publié: (2026)
Mocap-2-to-3: Multi-view Lifting for Monocular Motion Recovery with 2D Pretraining
par: Wang, Zhumei, et autres
Publié: (2025)
par: Wang, Zhumei, et autres
Publié: (2025)
RwoR: Generating Robot Demonstrations from Human Hand Collection for Policy Learning without Robot
par: Heng, Liang, et autres
Publié: (2025)
par: Heng, Liang, et autres
Publié: (2025)
LiftImage3D: Lifting Any Single Image to 3D Gaussians with Video Generation Priors
par: Chen, Yabo, et autres
Publié: (2024)
par: Chen, Yabo, et autres
Publié: (2024)
Lifting Unlabeled Internet-level Data for 3D Scene Understanding
par: Chen, Yixin, et autres
Publié: (2026)
par: Chen, Yixin, et autres
Publié: (2026)
LaST-R1: Reinforcing Robotic Manipulation via Adaptive Physical Latent Reasoning
par: Chen, Hao, et autres
Publié: (2026)
par: Chen, Hao, et autres
Publié: (2026)
A Self-Correcting Vision-Language-Action Model for Fast and Slow System Manipulation
par: Li, Chenxuan, et autres
Publié: (2024)
par: Li, Chenxuan, et autres
Publié: (2024)
Robo-Dopamine: General Process Reward Modeling for High-Precision Robotic Manipulation
par: Tan, Huajie, et autres
Publié: (2025)
par: Tan, Huajie, et autres
Publié: (2025)
Boxer: Robust Lifting of Open-World 2D Bounding Boxes to 3D
par: DeTone, Daniel, et autres
Publié: (2026)
par: DeTone, Daniel, et autres
Publié: (2026)
ManualVLA: A Unified VLA Model for Chain-of-Thought Manual Generation and Robotic Manipulation
par: Gu, Chenyang, et autres
Publié: (2025)
par: Gu, Chenyang, et autres
Publié: (2025)
AugLift: Depth-Aware Input Reparameterization Improves Domain Generalization in 2D-to-3D Pose Lifting
par: Warner, Nikolai, et autres
Publié: (2025)
par: Warner, Nikolai, et autres
Publié: (2025)
SaPaVe: Towards Active Perception and Manipulation in Vision-Language-Action Models for Robotics
par: Liu, Mengzhen, et autres
Publié: (2026)
par: Liu, Mengzhen, et autres
Publié: (2026)
Fast-in-Slow: A Dual-System Foundation Model Unifying Fast Manipulation within Slow Reasoning
par: Chen, Hao, et autres
Publié: (2025)
par: Chen, Hao, et autres
Publié: (2025)
3D-SSGAN: Lifting 2D Semantics for 3D-Aware Compositional Portrait Synthesis
par: Liu, Ruiqi, et autres
Publié: (2024)
par: Liu, Ruiqi, et autres
Publié: (2024)
DreamLifting: A Plug-in Module Lifting MV Diffusion Models for 3D Asset Generation
par: Yin, Ze-Xin, et autres
Publié: (2025)
par: Yin, Ze-Xin, et autres
Publié: (2025)
Towards Scalable Spatial Intelligence via 2D-to-3D Data Lifting
par: Miao, Xingyu, et autres
Publié: (2025)
par: Miao, Xingyu, et autres
Publié: (2025)
RoboMamba: Efficient Vision-Language-Action Model for Robotic Reasoning and Manipulation
par: Liu, Jiaming, et autres
Publié: (2024)
par: Liu, Jiaming, et autres
Publié: (2024)
The VOROS: Lifting ROC curves to 3D
par: Ratigan, Christopher, et autres
Publié: (2024)
par: Ratigan, Christopher, et autres
Publié: (2024)
MuPPet: Multi-person 2D-to-3D Pose Lifting
par: Markhorst, Thomas, et autres
Publié: (2026)
par: Markhorst, Thomas, et autres
Publié: (2026)
Segment, Lift and Fit: Automatic 3D Shape Labeling from 2D Prompts
par: Li, Jianhao, et autres
Publié: (2024)
par: Li, Jianhao, et autres
Publié: (2024)
MLA: A Multisensory Language-Action Model for Multimodal Understanding and Forecasting in Robotic Manipulation
par: Liu, Zhuoyang, et autres
Publié: (2025)
par: Liu, Zhuoyang, et autres
Publié: (2025)
PlaneCycle: Training-Free 2D-to-3D Lifting of Foundation Models Without Adapters
par: Yu, Yinghong, et autres
Publié: (2026)
par: Yu, Yinghong, et autres
Publié: (2026)
3D-MVP: 3D Multiview Pretraining for Robotic Manipulation
par: Qian, Shengyi, et autres
Publié: (2024)
par: Qian, Shengyi, et autres
Publié: (2024)
ManipDreamer3D : Synthesizing Plausible Robotic Manipulation Video with Occupancy-aware 3D Trajectory
par: Li, Ying, et autres
Publié: (2025)
par: Li, Ying, et autres
Publié: (2025)
SliceOcc: Indoor 3D Semantic Occupancy Prediction with Vertical Slice Representation
par: Li, Jianing, et autres
Publié: (2025)
par: Li, Jianing, et autres
Publié: (2025)
VideoLifter: Lifting Videos to 3D with Fast Hierarchical Stereo Alignment
par: Cong, Wenyan, et autres
Publié: (2025)
par: Cong, Wenyan, et autres
Publié: (2025)
Lifting Motion to the 3D World via 2D Diffusion
par: Li, Jiaman, et autres
Publié: (2024)
par: Li, Jiaman, et autres
Publié: (2024)
Object Agnostic 3D Lifting in Space and Time
par: Fusco, Christopher, et autres
Publié: (2024)
par: Fusco, Christopher, et autres
Publié: (2024)
FP3: A 3D Foundation Policy for Robotic Manipulation
par: Yang, Rujia, et autres
Publié: (2025)
par: Yang, Rujia, et autres
Publié: (2025)
LiftRefine: Progressively Refined View Synthesis from 3D Lifting with Volume-Triplane Representations
par: Do, Tung, et autres
Publié: (2024)
par: Do, Tung, et autres
Publié: (2024)
Action-Sketcher: From Reasoning to Action via Visual Sketches for Long-Horizon Robotic Manipulation
par: Tan, Huajie, et autres
Publié: (2026)
par: Tan, Huajie, et autres
Publié: (2026)
Perceptual Quality Assessment of Trisoup-Lifting Encoded 3D Point Clouds
par: Long, Juncheng, et autres
Publié: (2024)
par: Long, Juncheng, et autres
Publié: (2024)
RoboBrain: A Unified Brain Model for Robotic Manipulation from Abstract to Concrete
par: Ji, Yuheng, et autres
Publié: (2025)
par: Ji, Yuheng, et autres
Publié: (2025)
Rethinking Graph Convolution for 2D-to-3D Hand Pose Lifting
par: Kim, Chanyoung, et autres
Publié: (2026)
par: Kim, Chanyoung, et autres
Publié: (2026)
Documents similaires
-
AC-DiT: Adaptive Coordination Diffusion Transformer for Mobile Manipulation
par: Chen, Sixiang, et autres
Publié: (2025) -
Lift3D: Zero-Shot Lifting of Any 2D Vision Model to 3D
par: T, Mukund Varma, et autres
Publié: (2024) -
NTO3D: Neural Target Object 3D Reconstruction with Segment Anything
par: Wei, Xiaobao, et autres
Publié: (2023) -
3D-LFM: Lifting Foundation Model
par: Dabhi, Mosam, et autres
Publié: (2023) -
PLGS: Robust Panoptic Lifting with 3D Gaussian Splatting
par: Wang, Yu, et autres
Publié: (2024)