:: Library Catalog

Image de couverture de livre

Enregistré dans:

Détails bibliographiques
Auteurs principaux:	Jia, Yueru, Liu, Jiaming, Chen, Sixiang, Gu, Chenyang, Wang, Zhilue, Luo, Longzan, Lee, Lily, Wang, Pengwei, Wang, Zhongyuan, Zhang, Renrui, Zhang, Shanghang
Format:	Preprint
Publié:	2024
Sujets:	Computer Vision and Pattern Recognition
Accès en ligne:	https://arxiv.org/abs/2411.18623
Tags:	Ajouter un tag Pas de tags, Soyez le premier à ajouter un tag!

Documents similaires

AC-DiT: Adaptive Coordination Diffusion Transformer for Mobile Manipulation
par: Chen, Sixiang, et autres
Publié: (2025)

Lift3D: Zero-Shot Lifting of Any 2D Vision Model to 3D
par: T, Mukund Varma, et autres
Publié: (2024)

NTO3D: Neural Target Object 3D Reconstruction with Segment Anything
par: Wei, Xiaobao, et autres
Publié: (2023)

3D-LFM: Lifting Foundation Model
par: Dabhi, Mosam, et autres
Publié: (2023)

PLGS: Robust Panoptic Lifting with 3D Gaussian Splatting
par: Wang, Yu, et autres
Publié: (2024)

RenderOcc: Vision-Centric 3D Occupancy Prediction with 2D Rendering Supervision
par: Pan, Mingjie, et autres
Publié: (2023)

LAMP: Lift Image-Editing as General 3D Priors for Open-world Manipulation
par: Wang, Jingjing, et autres
Publié: (2026)

Mocap-2-to-3: Multi-view Lifting for Monocular Motion Recovery with 2D Pretraining
par: Wang, Zhumei, et autres
Publié: (2025)

RwoR: Generating Robot Demonstrations from Human Hand Collection for Policy Learning without Robot
par: Heng, Liang, et autres
Publié: (2025)

LiftImage3D: Lifting Any Single Image to 3D Gaussians with Video Generation Priors
par: Chen, Yabo, et autres
Publié: (2024)

Lifting Unlabeled Internet-level Data for 3D Scene Understanding
par: Chen, Yixin, et autres
Publié: (2026)

LaST-R1: Reinforcing Robotic Manipulation via Adaptive Physical Latent Reasoning
par: Chen, Hao, et autres
Publié: (2026)

A Self-Correcting Vision-Language-Action Model for Fast and Slow System Manipulation
par: Li, Chenxuan, et autres
Publié: (2024)

Robo-Dopamine: General Process Reward Modeling for High-Precision Robotic Manipulation
par: Tan, Huajie, et autres
Publié: (2025)

Boxer: Robust Lifting of Open-World 2D Bounding Boxes to 3D
par: DeTone, Daniel, et autres
Publié: (2026)

ManualVLA: A Unified VLA Model for Chain-of-Thought Manual Generation and Robotic Manipulation
par: Gu, Chenyang, et autres
Publié: (2025)

AugLift: Depth-Aware Input Reparameterization Improves Domain Generalization in 2D-to-3D Pose Lifting
par: Warner, Nikolai, et autres
Publié: (2025)

SaPaVe: Towards Active Perception and Manipulation in Vision-Language-Action Models for Robotics
par: Liu, Mengzhen, et autres
Publié: (2026)

Fast-in-Slow: A Dual-System Foundation Model Unifying Fast Manipulation within Slow Reasoning
par: Chen, Hao, et autres
Publié: (2025)

3D-SSGAN: Lifting 2D Semantics for 3D-Aware Compositional Portrait Synthesis
par: Liu, Ruiqi, et autres
Publié: (2024)

DreamLifting: A Plug-in Module Lifting MV Diffusion Models for 3D Asset Generation
par: Yin, Ze-Xin, et autres
Publié: (2025)

Towards Scalable Spatial Intelligence via 2D-to-3D Data Lifting
par: Miao, Xingyu, et autres
Publié: (2025)

RoboMamba: Efficient Vision-Language-Action Model for Robotic Reasoning and Manipulation
par: Liu, Jiaming, et autres
Publié: (2024)

The VOROS: Lifting ROC curves to 3D
par: Ratigan, Christopher, et autres
Publié: (2024)

MuPPet: Multi-person 2D-to-3D Pose Lifting
par: Markhorst, Thomas, et autres
Publié: (2026)

Segment, Lift and Fit: Automatic 3D Shape Labeling from 2D Prompts
par: Li, Jianhao, et autres
Publié: (2024)

MLA: A Multisensory Language-Action Model for Multimodal Understanding and Forecasting in Robotic Manipulation
par: Liu, Zhuoyang, et autres
Publié: (2025)

PlaneCycle: Training-Free 2D-to-3D Lifting of Foundation Models Without Adapters
par: Yu, Yinghong, et autres
Publié: (2026)

3D-MVP: 3D Multiview Pretraining for Robotic Manipulation
par: Qian, Shengyi, et autres
Publié: (2024)

ManipDreamer3D : Synthesizing Plausible Robotic Manipulation Video with Occupancy-aware 3D Trajectory
par: Li, Ying, et autres
Publié: (2025)

SliceOcc: Indoor 3D Semantic Occupancy Prediction with Vertical Slice Representation
par: Li, Jianing, et autres
Publié: (2025)

VideoLifter: Lifting Videos to 3D with Fast Hierarchical Stereo Alignment
par: Cong, Wenyan, et autres
Publié: (2025)

Lifting Motion to the 3D World via 2D Diffusion
par: Li, Jiaman, et autres
Publié: (2024)

Object Agnostic 3D Lifting in Space and Time
par: Fusco, Christopher, et autres
Publié: (2024)

FP3: A 3D Foundation Policy for Robotic Manipulation
par: Yang, Rujia, et autres
Publié: (2025)

LiftRefine: Progressively Refined View Synthesis from 3D Lifting with Volume-Triplane Representations
par: Do, Tung, et autres
Publié: (2024)

Action-Sketcher: From Reasoning to Action via Visual Sketches for Long-Horizon Robotic Manipulation
par: Tan, Huajie, et autres
Publié: (2026)

Perceptual Quality Assessment of Trisoup-Lifting Encoded 3D Point Clouds
par: Long, Juncheng, et autres
Publié: (2024)

RoboBrain: A Unified Brain Model for Robotic Manipulation from Abstract to Concrete
par: Ji, Yuheng, et autres
Publié: (2025)

Rethinking Graph Convolution for 2D-to-3D Hand Pose Lifting
par: Kim, Chanyoung, et autres
Publié: (2026)