:: Library Catalog

Buchumschlag

Gespeichert in:

Bibliographische Detailangaben
Hauptverfasser:	Ding, Henghui, Ying, Kaining, Liu, Chang, He, Shuting, Jiang, Xudong, Jiang, Yu-Gang, Torr, Philip H. S., Bai, Song
Format:	Preprint
Veröffentlicht:	2025
Schlagworte:	Computer Vision and Pattern Recognition
Online-Zugang:	https://arxiv.org/abs/2508.05630
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Ähnliche Einträge

MeViS: A Multi-Modal Dataset for Referring Motion Expression Video Segmentation
von: Ding, Henghui, et al.
Veröffentlicht: (2025)

GREx: Generalized Referring Expression Segmentation, Comprehension, and Generation
von: Ding, Henghui, et al.
Veröffentlicht: (2026)

MOVE: Motion-Guided Few-Shot Video Object Segmentation
von: Ying, Kaining, et al.
Veröffentlicht: (2025)

Towards Omnimodal Expressions and Reasoning in Referring Audio-Visual Segmentation
von: Ying, Kaining, et al.
Veröffentlicht: (2025)

SegPoint: Segment Any Point Cloud via Large Language Model
von: He, Shuting, et al.
Veröffentlicht: (2024)

Decoupling Static and Hierarchical Motion Perception for Referring Video Segmentation
von: He, Shuting, et al.
Veröffentlicht: (2024)

Multimodal Referring Segmentation: A Survey
von: Ding, Henghui, et al.
Veröffentlicht: (2025)

Segment Anything Across Shots: A Method and Benchmark
von: Hu, Hengrui, et al.
Veröffentlicht: (2025)

RefMask3D: Language-Guided Transformer for 3D Referring Segmentation
von: He, Shuting, et al.
Veröffentlicht: (2024)

ROSE: Retrieval-Oriented Segmentation Enhancement
von: Tang, Song, et al.
Veröffentlicht: (2026)

Open-set Anomaly Segmentation in Complex Scenarios
von: Xia, Song, et al.
Veröffentlicht: (2025)

Hierarchical Alignment-enhanced Adaptive Grounding Network for Generalized Referring Expression Comprehension
von: Wang, Yaxian, et al.
Veröffentlicht: (2025)

Mitigating the Curse of Dimensionality for Certified Robustness via Dual Randomized Smoothing
von: Xia, Song, et al.
Veröffentlicht: (2024)

2nd Place Report of MOSEv2 Challenge 2025: Concept Guided Video Object Segmentation via SeC
von: Zhang, Zhixiong, et al.
Veröffentlicht: (2025)

Evaluating SAM2 for Video Semantic Segmentation
von: Ariff, Syed Hesham Syed, et al.
Veröffentlicht: (2025)

LSVOS 2025 Challenge Report: Recent Advances in Complex Video Object Segmentation
von: Liu, Chang, et al.
Veröffentlicht: (2025)

SAM3-DMS: Decoupled Memory Selection for Multi-target Video Segmentation of SAM3
von: Shen, Ruiqi, et al.
Veröffentlicht: (2026)

Exploiting Temporal State Space Sharing for Video Semantic Segmentation
von: Hesham, Syed Ariff Syed, et al.
Veröffentlicht: (2025)

LSVOS Challenge Report: Large-scale Complex and Long Video Object Segmentation
von: Ding, Henghui, et al.
Veröffentlicht: (2024)

SceneDesigner: Controllable Multi-Object Image Generation with 9-DoF Pose Manipulation
von: Qin, Zhenyuan, et al.
Veröffentlicht: (2025)

PVUW 2024 Challenge on Complex Video Understanding: Methods and Results
von: Ding, Henghui, et al.
Veröffentlicht: (2024)

The 1st Solution for MOSEv2 Challenge 2025: Long-term and Concept-aware Video Segmentation via SeC
von: Gao, Mingqi, et al.
Veröffentlicht: (2025)

ReferSplat: Referring Segmentation in 3D Gaussian Splatting
von: He, Shuting, et al.
Veröffentlicht: (2025)

SAMA: Towards Multi-Turn Referential Grounded Video Chat with Large Language Models
von: Sun, Ye, et al.
Veröffentlicht: (2025)

PVUW 2025 Challenge Report: Advances in Pixel-level Understanding of Complex Videos in the Wild
von: Ding, Henghui, et al.
Veröffentlicht: (2025)

A Survey on 3D Gaussian Splatting Applications: Segmentation, Editing, and Generation
von: He, Shuting, et al.
Veröffentlicht: (2025)

4D Gaussian Splatting: Modeling Dynamic Scenes with Native 4D Primitives
von: Yang, Zeyu, et al.
Veröffentlicht: (2024)

Transferable Adversarial Attacks on SAM and Its Downstream Models
von: Xia, Song, et al.
Veröffentlicht: (2024)

The 1st Solution for MOSEv1 Challenge on LSVOS 2025: CGFSeg
von: Li, Tingmin, et al.
Veröffentlicht: (2025)

Scene-Conditional 3D Object Stylization and Composition
von: Zhou, Jinghao, et al.
Veröffentlicht: (2023)

Free-Form Scene Editor: Enabling Multi-Round Object Manipulation like in a 3D Engine
von: Shuai, Xincheng, et al.
Veröffentlicht: (2025)

EffectErase: Joint Video Object Removal and Insertion for High-Quality Effect Erasing
von: Fu, Yang, et al.
Veröffentlicht: (2026)

VMem: Consistent Interactive Video Scene Generation with Surfel-Indexed View Memory
von: Li, Runjia, et al.
Veröffentlicht: (2025)

Report of the 5th PVUW Challenge: Towards More Diverse Modalities in Pixel-Level Understanding
von: Liu, Chang, et al.
Veröffentlicht: (2026)

Enriched Feature Representation and Motion Prediction Module for MOSEv2 Track of 7th LSVOS Challenge: 3rd Place Solution
von: Lim, Chang Soo, et al.
Veröffentlicht: (2025)

WildDeepfake: A Challenging Real-World Dataset for Deepfake Detection
von: Zi, Bojia, et al.
Veröffentlicht: (2021)

Learning Local and Global Temporal Contexts for Video Semantic Segmentation
von: Sun, Guolei, et al.
Veröffentlicht: (2022)

A Survey of Multimodal-Guided Image Editing with Text-to-Image Diffusion Models
von: Shuai, Xincheng, et al.
Veröffentlicht: (2024)

SCORE: Scene Context Matters in Open-Vocabulary Remote Sensing Instance Segmentation
von: Huang, Shiqi, et al.
Veröffentlicht: (2025)

Placing Objects in Context via Inpainting for Out-of-distribution Segmentation
von: de Jorge, Pau, et al.
Veröffentlicht: (2024)