Gespeichert in:
| Hauptverfasser: | Ma, Xianzheng, Smart, Brandon, Bhalgat, Yash, Chen, Shuai, Li, Xinghui, Ding, Jian, Gu, Jindong, Chen, Dave Zhenyu, Peng, Songyou, Bian, Jia-Wang, Torr, Philip H, Pollefeys, Marc, Nießner, Matthias, Reid, Ian D, Chang, Angel X., Laina, Iro, Prisacariu, Victor Adrian |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2024
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2405.10255 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
Do 3D Large Language Models Really Understand 3D Spatial Relationships?
von: Ma, Xianzheng, et al.
Veröffentlicht: (2026)
von: Ma, Xianzheng, et al.
Veröffentlicht: (2026)
Splatt3R: Zero-shot Gaussian Splatting from Uncalibrated Image Pairs
von: Smart, Brandon, et al.
Veröffentlicht: (2024)
von: Smart, Brandon, et al.
Veröffentlicht: (2024)
3D-Aware Instance Segmentation and Tracking in Egocentric Videos
von: Bhalgat, Yash, et al.
Veröffentlicht: (2024)
von: Bhalgat, Yash, et al.
Veröffentlicht: (2024)
Neural Refinement for Absolute Pose Regression with Feature Synthesis
von: Chen, Shuai, et al.
Veröffentlicht: (2023)
von: Chen, Shuai, et al.
Veröffentlicht: (2023)
Reflect3r: Single-View 3D Stereo Reconstruction Aided by Mirror Reflections
von: Wu, Jing, et al.
Veröffentlicht: (2025)
von: Wu, Jing, et al.
Veröffentlicht: (2025)
N2F2: Hierarchical Scene Understanding with Nested Neural Feature Fields
von: Bhalgat, Yash, et al.
Veröffentlicht: (2024)
von: Bhalgat, Yash, et al.
Veröffentlicht: (2024)
GaussCtrl: Multi-View Consistent Text-Driven 3D Gaussian Splatting Editing
von: Wu, Jing, et al.
Veröffentlicht: (2024)
von: Wu, Jing, et al.
Veröffentlicht: (2024)
GS-CPR: Efficient Camera Pose Refinement via 3D Gaussian Splatting
von: Liu, Changkun, et al.
Veröffentlicht: (2024)
von: Liu, Changkun, et al.
Veröffentlicht: (2024)
DGE: Direct Gaussian 3D Editing by Consistent Multi-view Editing
von: Chen, Minghao, et al.
Veröffentlicht: (2024)
von: Chen, Minghao, et al.
Veröffentlicht: (2024)
Active View Selector: Fast and Accurate Active View Selection with Cross Reference Image Quality Assessment
von: Wang, Zirui, et al.
Veröffentlicht: (2025)
von: Wang, Zirui, et al.
Veröffentlicht: (2025)
Invisible Stitch: Generating Smooth 3D Scenes with Depth Inpainting
von: Engstler, Paul, et al.
Veröffentlicht: (2024)
von: Engstler, Paul, et al.
Veröffentlicht: (2024)
Layered Motion Fusion: Lifting Motion Segmentation to 3D in Egocentric Videos
von: Tschernezki, Vadim, et al.
Veröffentlicht: (2025)
von: Tschernezki, Vadim, et al.
Veröffentlicht: (2025)
Volumetric Semantically Consistent 3D Panoptic Mapping
von: Miao, Yang, et al.
Veröffentlicht: (2023)
von: Miao, Yang, et al.
Veröffentlicht: (2023)
OpenDAS: Open-Vocabulary Domain Adaptation for 2D and 3D Segmentation
von: Yilmaz, Gonca, et al.
Veröffentlicht: (2024)
von: Yilmaz, Gonca, et al.
Veröffentlicht: (2024)
SynCity: Training-Free Generation of 3D Worlds
von: Engstler, Paul, et al.
Veröffentlicht: (2025)
von: Engstler, Paul, et al.
Veröffentlicht: (2025)
Seeing in the Dark: Benchmarking Egocentric 3D Vision with the Oxford Day-and-Night Dataset
von: Wang, Zirui, et al.
Veröffentlicht: (2025)
von: Wang, Zirui, et al.
Veröffentlicht: (2025)
WildGaussians: 3D Gaussian Splatting in the Wild
von: Kulhanek, Jonas, et al.
Veröffentlicht: (2024)
von: Kulhanek, Jonas, et al.
Veröffentlicht: (2024)
MAP-ADAPT: Real-Time Quality-Adaptive Semantic 3D Maps
von: Zheng, Jianhao, et al.
Veröffentlicht: (2024)
von: Zheng, Jianhao, et al.
Veröffentlicht: (2024)
WildGS-SLAM: Monocular Gaussian Splatting SLAM in Dynamic Environments
von: Zheng, Jianhao, et al.
Veröffentlicht: (2025)
von: Zheng, Jianhao, et al.
Veröffentlicht: (2025)
Reproducibility Study of CDUL: CLIP-Driven Unsupervised Learning for Multi-Label Image Classification
von: Shah, Manan, et al.
Veröffentlicht: (2024)
von: Shah, Manan, et al.
Veröffentlicht: (2024)
PoRF: Pose Residual Field for Accurate Neural Surface Reconstruction
von: Bian, Jia-Wang, et al.
Veröffentlicht: (2023)
von: Bian, Jia-Wang, et al.
Veröffentlicht: (2023)
Geo4D: Leveraging Video Generators for Geometric 4D Scene Reconstruction
von: Jiang, Zeren, et al.
Veröffentlicht: (2025)
von: Jiang, Zeren, et al.
Veröffentlicht: (2025)
Mesh4D: 4D Mesh Reconstruction and Tracking from Monocular Video
von: Jiang, Zeren, et al.
Veröffentlicht: (2026)
von: Jiang, Zeren, et al.
Veröffentlicht: (2026)
PartGen: Part-level 3D Generation and Reconstruction with Multi-View Diffusion Models
von: Chen, Minghao, et al.
Veröffentlicht: (2024)
von: Chen, Minghao, et al.
Veröffentlicht: (2024)
IM-3D: Iterative Multiview Diffusion and Reconstruction for High-Quality 3D Generation
von: Melas-Kyriazi, Luke, et al.
Veröffentlicht: (2024)
von: Melas-Kyriazi, Luke, et al.
Veröffentlicht: (2024)
3D Neural Edge Reconstruction
von: Li, Lei, et al.
Veröffentlicht: (2024)
von: Li, Lei, et al.
Veröffentlicht: (2024)
CrossOver: 3D Scene Cross-Modal Alignment
von: Sarkar, Sayan Deb, et al.
Veröffentlicht: (2025)
von: Sarkar, Sayan Deb, et al.
Veröffentlicht: (2025)
When Do Diffusion Models learn to Generate Multiple Objects?
von: Jeong, Yujin, et al.
Veröffentlicht: (2026)
von: Jeong, Yujin, et al.
Veröffentlicht: (2026)
Does Your 3D Encoder Really Work? When Pretrain-SFT from 2D VLMs Meets 3D VLMs
von: Li, Haoyuan, et al.
Veröffentlicht: (2025)
von: Li, Haoyuan, et al.
Veröffentlicht: (2025)
AutoPartGen: Autogressive 3D Part Generation and Discovery
von: Chen, Minghao, et al.
Veröffentlicht: (2025)
von: Chen, Minghao, et al.
Veröffentlicht: (2025)
TRAVL: A Recipe for Making Video-Language Models Better Judges of Physics Implausibility
von: Motamed, Saman, et al.
Veröffentlicht: (2025)
von: Motamed, Saman, et al.
Veröffentlicht: (2025)
EPIC Fields: Marrying 3D Geometry and Video Understanding
von: Tschernezki, Vadim, et al.
Veröffentlicht: (2023)
von: Tschernezki, Vadim, et al.
Veröffentlicht: (2023)
SD4Match: Learning to Prompt Stable Diffusion Model for Semantic Matching
von: Li, Xinghui, et al.
Veröffentlicht: (2023)
von: Li, Xinghui, et al.
Veröffentlicht: (2023)
No Pose, No Problem: Surprisingly Simple 3D Gaussian Splats from Sparse Unposed Images
von: Ye, Botao, et al.
Veröffentlicht: (2024)
von: Ye, Botao, et al.
Veröffentlicht: (2024)
Diffusion Models for Open-Vocabulary Segmentation
von: Karazija, Laurynas, et al.
Veröffentlicht: (2023)
von: Karazija, Laurynas, et al.
Veröffentlicht: (2023)
Learning segmentation from point trajectories
von: Karazija, Laurynas, et al.
Veröffentlicht: (2025)
von: Karazija, Laurynas, et al.
Veröffentlicht: (2025)
Parametric modal regression with error in covariates
von: Qingyang Liu, et al.
Veröffentlicht: (2024)
von: Qingyang Liu, et al.
Veröffentlicht: (2024)
Nothing Stands Still: A Spatiotemporal Benchmark on 3D Point Cloud Registration Under Large Geometric and Temporal Change
von: Sun, Tao, et al.
Veröffentlicht: (2023)
von: Sun, Tao, et al.
Veröffentlicht: (2023)
DreamEdit3D: Personalization of Multi-View Diffusion Models for 3D Editing
von: Ai, Jinxin, et al.
Veröffentlicht: (2026)
von: Ai, Jinxin, et al.
Veröffentlicht: (2026)
"Where am I?" Scene Retrieval with Language
von: Chen, Jiaqi, et al.
Veröffentlicht: (2024)
von: Chen, Jiaqi, et al.
Veröffentlicht: (2024)
Ähnliche Einträge
-
Do 3D Large Language Models Really Understand 3D Spatial Relationships?
von: Ma, Xianzheng, et al.
Veröffentlicht: (2026) -
Splatt3R: Zero-shot Gaussian Splatting from Uncalibrated Image Pairs
von: Smart, Brandon, et al.
Veröffentlicht: (2024) -
3D-Aware Instance Segmentation and Tracking in Egocentric Videos
von: Bhalgat, Yash, et al.
Veröffentlicht: (2024) -
Neural Refinement for Absolute Pose Regression with Feature Synthesis
von: Chen, Shuai, et al.
Veröffentlicht: (2023) -
Reflect3r: Single-View 3D Stereo Reconstruction Aided by Mirror Reflections
von: Wu, Jing, et al.
Veröffentlicht: (2025)