:: Library Catalog

Beeld op de omslag

Bewaard in:

Bibliografische gegevens
Hoofdauteurs:	Liyi, Chen, Pengfei, Wang, Guowen, Zhang, Zhiyuan, Ma, Lei, Zhang
Formaat:	Preprint
Gepubliceerd in:	2026
Onderwerpen:	Computer Vision and Pattern Recognition
Online toegang:	https://arxiv.org/abs/2603.17841
Tags:	Voeg label toe Geen labels, Wees de eerste die dit record labelt!

Gelijkaardige items

One2Scene: Geometric Consistent Explorable 3D Scene Generation from a Single Image
door: Wang, Pengfei, et al.
Gepubliceerd in: (2026)

Fast Multi-view Consistent 3D Editing with Video Priors
door: Chen, Liyi, et al.
Gepubliceerd in: (2025)

General Geometry-aware Weakly Supervised 3D Object Detection
door: Zhang, Guowen, et al.
Gepubliceerd in: (2024)

BEVDilation: LiDAR-Centric Multi-Modal Fusion for 3D Object Detection
door: Zhang, Guowen, et al.
Gepubliceerd in: (2025)

3DEditSafe: Defending 3D Editing Pipelines from Unsafe Generation
door: Meng, Nicole, et al.
Gepubliceerd in: (2026)

SyncNoise: Geometrically Consistent Noise Prediction for Text-based 3D Scene Editing
door: Li, Ruihuang, et al.
Gepubliceerd in: (2024)

OmniV2V: Versatile Video Generation and Editing via Dynamic Content Manipulation
door: Liang, Sen, et al.
Gepubliceerd in: (2025)

Audio-Omni: Extending Multi-modal Understanding to Versatile Audio Generation and Editing
door: Tian, Zeyue, et al.
Gepubliceerd in: (2026)

DreamOmni3: Scribble-based Editing and Generation
door: Xia, Bin, et al.
Gepubliceerd in: (2025)

DreamOmni: Unified Image Generation and Editing
door: Xia, Bin, et al.
Gepubliceerd in: (2024)

3D-GOI: 3D GAN Omni-Inversion for Multifaceted and Multi-object Editing
door: Li, Haoran, et al.
Gepubliceerd in: (2023)

Omni$^2$: Unifying Omnidirectional Image Generation and Editing in an Omni Model
door: Yang, Liu, et al.
Gepubliceerd in: (2025)

Generalized and Efficient 2D Gaussian Splatting for Arbitrary-scale Super-Resolution
door: Chen, Du, et al.
Gepubliceerd in: (2025)

Structured 3D Latents for Scalable and Versatile 3D Generation
door: Xiang, Jianfeng, et al.
Gepubliceerd in: (2024)

InsViE-1M: Effective Instruction-based Video Editing with Elaborate Dataset Construction
door: Wu, Yuhui, et al.
Gepubliceerd in: (2025)

DragTex: Generative Point-Based Texture Editing on 3D Mesh
door: Zhang, Yudi, et al.
Gepubliceerd in: (2024)

Voxel Mamba: Group-Free State Space Models for Point Cloud based 3D Object Detection
door: Zhang, Guowen, et al.
Gepubliceerd in: (2024)

CoCoEdit: Content-Consistent Image Editing via Region Regularized Reinforcement Learning
door: Wu, Yuhui, et al.
Gepubliceerd in: (2026)

Memorize When Needed: Decoupled Memory Control for Spatially Consistent Long-Horizon Video Generation
door: Guo, Yanjun, et al.
Gepubliceerd in: (2026)

AlignCVC: Aligning Cross-View Consistency for Single-Image-to-3D Generation
door: Liang, Xinyue, et al.
Gepubliceerd in: (2025)

DreamOmni2: Multimodal Instruction-based Editing and Generation
door: Xia, Bin, et al.
Gepubliceerd in: (2025)

SceneGen: Single-Image 3D Scene Generation in One Feedforward Pass
door: Meng, Yanxu, et al.
Gepubliceerd in: (2025)

Tele-Omni: a Unified Multimodal Framework for Video Generation and Editing
door: Liu, Jialun, et al.
Gepubliceerd in: (2026)

OmniIndoor3D: Comprehensive Indoor 3D Reconstruction
door: Wei, Xiaobao, et al.
Gepubliceerd in: (2025)

CMD: Controllable Multiview Diffusion for 3D Editing and Progressive Generation
door: Li, Peng, et al.
Gepubliceerd in: (2025)

Physics-Aware 3D Gaussian Editing for Driving Scene Generation
door: Zhou, Feng, et al.
Gepubliceerd in: (2026)

OmniGuard: Hybrid Manipulation Localization via Augmented Versatile Deep Image Watermarking
door: Zhang, Xuanyu, et al.
Gepubliceerd in: (2024)

OmniMotion-X: Versatile Multimodal Whole-Body Motion Generation
door: Xu, Guowei, et al.
Gepubliceerd in: (2025)

OmniCamera: A Unified Framework for Multi-task Video Generation with Arbitrary Camera Control
door: Wang, Yukun, et al.
Gepubliceerd in: (2026)

Open Vocabulary 3D Scene Understanding via Geometry Guided Self-Distillation
door: Wang, Pengfei, et al.
Gepubliceerd in: (2024)

OmniActor: A Generalist GUI and Embodied Agent for 2D&3D Worlds
door: Yang, Longrong, et al.
Gepubliceerd in: (2025)

Omni-o3: Deep Nested Omnimodal Deduction for Deliberative Audio-Visual Reasoning
door: Zhang, Zhicheng, et al.
Gepubliceerd in: (2026)

Progressive3D: Progressively Local Editing for Text-to-3D Content Creation with Complex Semantic Prompts
door: Cheng, Xinhua, et al.
Gepubliceerd in: (2023)

Text to Image Generation and Editing: A Survey
door: Yang, Pengfei, et al.
Gepubliceerd in: (2025)

ScatterFormer: Efficient Voxel Transformer with Scattered Linear Attention
door: He, Chenhang, et al.
Gepubliceerd in: (2024)

ViT-Lens: Initiating Omni-Modal Exploration through 3D Insights
door: Lei, Weixian, et al.
Gepubliceerd in: (2023)

I2V3D: Controllable image-to-video generation with 3D guidance
door: Zhang, Zhiyuan, et al.
Gepubliceerd in: (2025)

OmniX: From Unified Panoramic Generation and Perception to Graphics-Ready 3D Scenes
door: Huang, Yukun, et al.
Gepubliceerd in: (2025)

OmniEVA: Embodied Versatile Planner via Task-Adaptive 3D-Grounded and Embodiment-aware Reasoning
door: Liu, Yuecheng, et al.
Gepubliceerd in: (2025)

Dense Multimodal Alignment for Open-Vocabulary 3D Scene Understanding
door: Li, Ruihuang, et al.
Gepubliceerd in: (2024)