Bewaard in:
| Hoofdauteurs: | Liyi, Chen, Pengfei, Wang, Guowen, Zhang, Zhiyuan, Ma, Lei, Zhang |
|---|---|
| Formaat: | Preprint |
| Gepubliceerd in: |
2026
|
| Onderwerpen: | |
| Online toegang: | https://arxiv.org/abs/2603.17841 |
| Tags: |
Voeg label toe
Geen labels, Wees de eerste die dit record labelt!
|
Gelijkaardige items
One2Scene: Geometric Consistent Explorable 3D Scene Generation from a Single Image
door: Wang, Pengfei, et al.
Gepubliceerd in: (2026)
door: Wang, Pengfei, et al.
Gepubliceerd in: (2026)
Fast Multi-view Consistent 3D Editing with Video Priors
door: Chen, Liyi, et al.
Gepubliceerd in: (2025)
door: Chen, Liyi, et al.
Gepubliceerd in: (2025)
General Geometry-aware Weakly Supervised 3D Object Detection
door: Zhang, Guowen, et al.
Gepubliceerd in: (2024)
door: Zhang, Guowen, et al.
Gepubliceerd in: (2024)
BEVDilation: LiDAR-Centric Multi-Modal Fusion for 3D Object Detection
door: Zhang, Guowen, et al.
Gepubliceerd in: (2025)
door: Zhang, Guowen, et al.
Gepubliceerd in: (2025)
3DEditSafe: Defending 3D Editing Pipelines from Unsafe Generation
door: Meng, Nicole, et al.
Gepubliceerd in: (2026)
door: Meng, Nicole, et al.
Gepubliceerd in: (2026)
SyncNoise: Geometrically Consistent Noise Prediction for Text-based 3D Scene Editing
door: Li, Ruihuang, et al.
Gepubliceerd in: (2024)
door: Li, Ruihuang, et al.
Gepubliceerd in: (2024)
OmniV2V: Versatile Video Generation and Editing via Dynamic Content Manipulation
door: Liang, Sen, et al.
Gepubliceerd in: (2025)
door: Liang, Sen, et al.
Gepubliceerd in: (2025)
Audio-Omni: Extending Multi-modal Understanding to Versatile Audio Generation and Editing
door: Tian, Zeyue, et al.
Gepubliceerd in: (2026)
door: Tian, Zeyue, et al.
Gepubliceerd in: (2026)
DreamOmni3: Scribble-based Editing and Generation
door: Xia, Bin, et al.
Gepubliceerd in: (2025)
door: Xia, Bin, et al.
Gepubliceerd in: (2025)
DreamOmni: Unified Image Generation and Editing
door: Xia, Bin, et al.
Gepubliceerd in: (2024)
door: Xia, Bin, et al.
Gepubliceerd in: (2024)
3D-GOI: 3D GAN Omni-Inversion for Multifaceted and Multi-object Editing
door: Li, Haoran, et al.
Gepubliceerd in: (2023)
door: Li, Haoran, et al.
Gepubliceerd in: (2023)
Omni$^2$: Unifying Omnidirectional Image Generation and Editing in an Omni Model
door: Yang, Liu, et al.
Gepubliceerd in: (2025)
door: Yang, Liu, et al.
Gepubliceerd in: (2025)
Generalized and Efficient 2D Gaussian Splatting for Arbitrary-scale Super-Resolution
door: Chen, Du, et al.
Gepubliceerd in: (2025)
door: Chen, Du, et al.
Gepubliceerd in: (2025)
Structured 3D Latents for Scalable and Versatile 3D Generation
door: Xiang, Jianfeng, et al.
Gepubliceerd in: (2024)
door: Xiang, Jianfeng, et al.
Gepubliceerd in: (2024)
InsViE-1M: Effective Instruction-based Video Editing with Elaborate Dataset Construction
door: Wu, Yuhui, et al.
Gepubliceerd in: (2025)
door: Wu, Yuhui, et al.
Gepubliceerd in: (2025)
DragTex: Generative Point-Based Texture Editing on 3D Mesh
door: Zhang, Yudi, et al.
Gepubliceerd in: (2024)
door: Zhang, Yudi, et al.
Gepubliceerd in: (2024)
Voxel Mamba: Group-Free State Space Models for Point Cloud based 3D Object Detection
door: Zhang, Guowen, et al.
Gepubliceerd in: (2024)
door: Zhang, Guowen, et al.
Gepubliceerd in: (2024)
CoCoEdit: Content-Consistent Image Editing via Region Regularized Reinforcement Learning
door: Wu, Yuhui, et al.
Gepubliceerd in: (2026)
door: Wu, Yuhui, et al.
Gepubliceerd in: (2026)
Memorize When Needed: Decoupled Memory Control for Spatially Consistent Long-Horizon Video Generation
door: Guo, Yanjun, et al.
Gepubliceerd in: (2026)
door: Guo, Yanjun, et al.
Gepubliceerd in: (2026)
AlignCVC: Aligning Cross-View Consistency for Single-Image-to-3D Generation
door: Liang, Xinyue, et al.
Gepubliceerd in: (2025)
door: Liang, Xinyue, et al.
Gepubliceerd in: (2025)
DreamOmni2: Multimodal Instruction-based Editing and Generation
door: Xia, Bin, et al.
Gepubliceerd in: (2025)
door: Xia, Bin, et al.
Gepubliceerd in: (2025)
SceneGen: Single-Image 3D Scene Generation in One Feedforward Pass
door: Meng, Yanxu, et al.
Gepubliceerd in: (2025)
door: Meng, Yanxu, et al.
Gepubliceerd in: (2025)
Tele-Omni: a Unified Multimodal Framework for Video Generation and Editing
door: Liu, Jialun, et al.
Gepubliceerd in: (2026)
door: Liu, Jialun, et al.
Gepubliceerd in: (2026)
OmniIndoor3D: Comprehensive Indoor 3D Reconstruction
door: Wei, Xiaobao, et al.
Gepubliceerd in: (2025)
door: Wei, Xiaobao, et al.
Gepubliceerd in: (2025)
CMD: Controllable Multiview Diffusion for 3D Editing and Progressive Generation
door: Li, Peng, et al.
Gepubliceerd in: (2025)
door: Li, Peng, et al.
Gepubliceerd in: (2025)
Physics-Aware 3D Gaussian Editing for Driving Scene Generation
door: Zhou, Feng, et al.
Gepubliceerd in: (2026)
door: Zhou, Feng, et al.
Gepubliceerd in: (2026)
OmniGuard: Hybrid Manipulation Localization via Augmented Versatile Deep Image Watermarking
door: Zhang, Xuanyu, et al.
Gepubliceerd in: (2024)
door: Zhang, Xuanyu, et al.
Gepubliceerd in: (2024)
OmniMotion-X: Versatile Multimodal Whole-Body Motion Generation
door: Xu, Guowei, et al.
Gepubliceerd in: (2025)
door: Xu, Guowei, et al.
Gepubliceerd in: (2025)
OmniCamera: A Unified Framework for Multi-task Video Generation with Arbitrary Camera Control
door: Wang, Yukun, et al.
Gepubliceerd in: (2026)
door: Wang, Yukun, et al.
Gepubliceerd in: (2026)
Open Vocabulary 3D Scene Understanding via Geometry Guided Self-Distillation
door: Wang, Pengfei, et al.
Gepubliceerd in: (2024)
door: Wang, Pengfei, et al.
Gepubliceerd in: (2024)
OmniActor: A Generalist GUI and Embodied Agent for 2D&3D Worlds
door: Yang, Longrong, et al.
Gepubliceerd in: (2025)
door: Yang, Longrong, et al.
Gepubliceerd in: (2025)
Omni-o3: Deep Nested Omnimodal Deduction for Deliberative Audio-Visual Reasoning
door: Zhang, Zhicheng, et al.
Gepubliceerd in: (2026)
door: Zhang, Zhicheng, et al.
Gepubliceerd in: (2026)
Progressive3D: Progressively Local Editing for Text-to-3D Content Creation with Complex Semantic Prompts
door: Cheng, Xinhua, et al.
Gepubliceerd in: (2023)
door: Cheng, Xinhua, et al.
Gepubliceerd in: (2023)
Text to Image Generation and Editing: A Survey
door: Yang, Pengfei, et al.
Gepubliceerd in: (2025)
door: Yang, Pengfei, et al.
Gepubliceerd in: (2025)
ScatterFormer: Efficient Voxel Transformer with Scattered Linear Attention
door: He, Chenhang, et al.
Gepubliceerd in: (2024)
door: He, Chenhang, et al.
Gepubliceerd in: (2024)
ViT-Lens: Initiating Omni-Modal Exploration through 3D Insights
door: Lei, Weixian, et al.
Gepubliceerd in: (2023)
door: Lei, Weixian, et al.
Gepubliceerd in: (2023)
I2V3D: Controllable image-to-video generation with 3D guidance
door: Zhang, Zhiyuan, et al.
Gepubliceerd in: (2025)
door: Zhang, Zhiyuan, et al.
Gepubliceerd in: (2025)
OmniX: From Unified Panoramic Generation and Perception to Graphics-Ready 3D Scenes
door: Huang, Yukun, et al.
Gepubliceerd in: (2025)
door: Huang, Yukun, et al.
Gepubliceerd in: (2025)
OmniEVA: Embodied Versatile Planner via Task-Adaptive 3D-Grounded and Embodiment-aware Reasoning
door: Liu, Yuecheng, et al.
Gepubliceerd in: (2025)
door: Liu, Yuecheng, et al.
Gepubliceerd in: (2025)
Dense Multimodal Alignment for Open-Vocabulary 3D Scene Understanding
door: Li, Ruihuang, et al.
Gepubliceerd in: (2024)
door: Li, Ruihuang, et al.
Gepubliceerd in: (2024)
Gelijkaardige items
-
One2Scene: Geometric Consistent Explorable 3D Scene Generation from a Single Image
door: Wang, Pengfei, et al.
Gepubliceerd in: (2026) -
Fast Multi-view Consistent 3D Editing with Video Priors
door: Chen, Liyi, et al.
Gepubliceerd in: (2025) -
General Geometry-aware Weakly Supervised 3D Object Detection
door: Zhang, Guowen, et al.
Gepubliceerd in: (2024) -
BEVDilation: LiDAR-Centric Multi-Modal Fusion for 3D Object Detection
door: Zhang, Guowen, et al.
Gepubliceerd in: (2025) -
3DEditSafe: Defending 3D Editing Pipelines from Unsafe Generation
door: Meng, Nicole, et al.
Gepubliceerd in: (2026)