Gespeichert in:
| Hauptverfasser: | Ding, Henghui, Ying, Kaining, Liu, Chang, He, Shuting, Jiang, Xudong, Jiang, Yu-Gang, Torr, Philip H. S., Bai, Song |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2025
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2508.05630 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
MeViS: A Multi-Modal Dataset for Referring Motion Expression Video Segmentation
von: Ding, Henghui, et al.
Veröffentlicht: (2025)
von: Ding, Henghui, et al.
Veröffentlicht: (2025)
GREx: Generalized Referring Expression Segmentation, Comprehension, and Generation
von: Ding, Henghui, et al.
Veröffentlicht: (2026)
von: Ding, Henghui, et al.
Veröffentlicht: (2026)
MOVE: Motion-Guided Few-Shot Video Object Segmentation
von: Ying, Kaining, et al.
Veröffentlicht: (2025)
von: Ying, Kaining, et al.
Veröffentlicht: (2025)
Towards Omnimodal Expressions and Reasoning in Referring Audio-Visual Segmentation
von: Ying, Kaining, et al.
Veröffentlicht: (2025)
von: Ying, Kaining, et al.
Veröffentlicht: (2025)
SegPoint: Segment Any Point Cloud via Large Language Model
von: He, Shuting, et al.
Veröffentlicht: (2024)
von: He, Shuting, et al.
Veröffentlicht: (2024)
Decoupling Static and Hierarchical Motion Perception for Referring Video Segmentation
von: He, Shuting, et al.
Veröffentlicht: (2024)
von: He, Shuting, et al.
Veröffentlicht: (2024)
Multimodal Referring Segmentation: A Survey
von: Ding, Henghui, et al.
Veröffentlicht: (2025)
von: Ding, Henghui, et al.
Veröffentlicht: (2025)
Segment Anything Across Shots: A Method and Benchmark
von: Hu, Hengrui, et al.
Veröffentlicht: (2025)
von: Hu, Hengrui, et al.
Veröffentlicht: (2025)
RefMask3D: Language-Guided Transformer for 3D Referring Segmentation
von: He, Shuting, et al.
Veröffentlicht: (2024)
von: He, Shuting, et al.
Veröffentlicht: (2024)
ROSE: Retrieval-Oriented Segmentation Enhancement
von: Tang, Song, et al.
Veröffentlicht: (2026)
von: Tang, Song, et al.
Veröffentlicht: (2026)
Open-set Anomaly Segmentation in Complex Scenarios
von: Xia, Song, et al.
Veröffentlicht: (2025)
von: Xia, Song, et al.
Veröffentlicht: (2025)
Hierarchical Alignment-enhanced Adaptive Grounding Network for Generalized Referring Expression Comprehension
von: Wang, Yaxian, et al.
Veröffentlicht: (2025)
von: Wang, Yaxian, et al.
Veröffentlicht: (2025)
Mitigating the Curse of Dimensionality for Certified Robustness via Dual Randomized Smoothing
von: Xia, Song, et al.
Veröffentlicht: (2024)
von: Xia, Song, et al.
Veröffentlicht: (2024)
2nd Place Report of MOSEv2 Challenge 2025: Concept Guided Video Object Segmentation via SeC
von: Zhang, Zhixiong, et al.
Veröffentlicht: (2025)
von: Zhang, Zhixiong, et al.
Veröffentlicht: (2025)
Evaluating SAM2 for Video Semantic Segmentation
von: Ariff, Syed Hesham Syed, et al.
Veröffentlicht: (2025)
von: Ariff, Syed Hesham Syed, et al.
Veröffentlicht: (2025)
LSVOS 2025 Challenge Report: Recent Advances in Complex Video Object Segmentation
von: Liu, Chang, et al.
Veröffentlicht: (2025)
von: Liu, Chang, et al.
Veröffentlicht: (2025)
SAM3-DMS: Decoupled Memory Selection for Multi-target Video Segmentation of SAM3
von: Shen, Ruiqi, et al.
Veröffentlicht: (2026)
von: Shen, Ruiqi, et al.
Veröffentlicht: (2026)
Exploiting Temporal State Space Sharing for Video Semantic Segmentation
von: Hesham, Syed Ariff Syed, et al.
Veröffentlicht: (2025)
von: Hesham, Syed Ariff Syed, et al.
Veröffentlicht: (2025)
LSVOS Challenge Report: Large-scale Complex and Long Video Object Segmentation
von: Ding, Henghui, et al.
Veröffentlicht: (2024)
von: Ding, Henghui, et al.
Veröffentlicht: (2024)
SceneDesigner: Controllable Multi-Object Image Generation with 9-DoF Pose Manipulation
von: Qin, Zhenyuan, et al.
Veröffentlicht: (2025)
von: Qin, Zhenyuan, et al.
Veröffentlicht: (2025)
PVUW 2024 Challenge on Complex Video Understanding: Methods and Results
von: Ding, Henghui, et al.
Veröffentlicht: (2024)
von: Ding, Henghui, et al.
Veröffentlicht: (2024)
The 1st Solution for MOSEv2 Challenge 2025: Long-term and Concept-aware Video Segmentation via SeC
von: Gao, Mingqi, et al.
Veröffentlicht: (2025)
von: Gao, Mingqi, et al.
Veröffentlicht: (2025)
ReferSplat: Referring Segmentation in 3D Gaussian Splatting
von: He, Shuting, et al.
Veröffentlicht: (2025)
von: He, Shuting, et al.
Veröffentlicht: (2025)
SAMA: Towards Multi-Turn Referential Grounded Video Chat with Large Language Models
von: Sun, Ye, et al.
Veröffentlicht: (2025)
von: Sun, Ye, et al.
Veröffentlicht: (2025)
PVUW 2025 Challenge Report: Advances in Pixel-level Understanding of Complex Videos in the Wild
von: Ding, Henghui, et al.
Veröffentlicht: (2025)
von: Ding, Henghui, et al.
Veröffentlicht: (2025)
A Survey on 3D Gaussian Splatting Applications: Segmentation, Editing, and Generation
von: He, Shuting, et al.
Veröffentlicht: (2025)
von: He, Shuting, et al.
Veröffentlicht: (2025)
4D Gaussian Splatting: Modeling Dynamic Scenes with Native 4D Primitives
von: Yang, Zeyu, et al.
Veröffentlicht: (2024)
von: Yang, Zeyu, et al.
Veröffentlicht: (2024)
Transferable Adversarial Attacks on SAM and Its Downstream Models
von: Xia, Song, et al.
Veröffentlicht: (2024)
von: Xia, Song, et al.
Veröffentlicht: (2024)
The 1st Solution for MOSEv1 Challenge on LSVOS 2025: CGFSeg
von: Li, Tingmin, et al.
Veröffentlicht: (2025)
von: Li, Tingmin, et al.
Veröffentlicht: (2025)
Scene-Conditional 3D Object Stylization and Composition
von: Zhou, Jinghao, et al.
Veröffentlicht: (2023)
von: Zhou, Jinghao, et al.
Veröffentlicht: (2023)
Free-Form Scene Editor: Enabling Multi-Round Object Manipulation like in a 3D Engine
von: Shuai, Xincheng, et al.
Veröffentlicht: (2025)
von: Shuai, Xincheng, et al.
Veröffentlicht: (2025)
EffectErase: Joint Video Object Removal and Insertion for High-Quality Effect Erasing
von: Fu, Yang, et al.
Veröffentlicht: (2026)
von: Fu, Yang, et al.
Veröffentlicht: (2026)
VMem: Consistent Interactive Video Scene Generation with Surfel-Indexed View Memory
von: Li, Runjia, et al.
Veröffentlicht: (2025)
von: Li, Runjia, et al.
Veröffentlicht: (2025)
Report of the 5th PVUW Challenge: Towards More Diverse Modalities in Pixel-Level Understanding
von: Liu, Chang, et al.
Veröffentlicht: (2026)
von: Liu, Chang, et al.
Veröffentlicht: (2026)
Enriched Feature Representation and Motion Prediction Module for MOSEv2 Track of 7th LSVOS Challenge: 3rd Place Solution
von: Lim, Chang Soo, et al.
Veröffentlicht: (2025)
von: Lim, Chang Soo, et al.
Veröffentlicht: (2025)
WildDeepfake: A Challenging Real-World Dataset for Deepfake Detection
von: Zi, Bojia, et al.
Veröffentlicht: (2021)
von: Zi, Bojia, et al.
Veröffentlicht: (2021)
Learning Local and Global Temporal Contexts for Video Semantic Segmentation
von: Sun, Guolei, et al.
Veröffentlicht: (2022)
von: Sun, Guolei, et al.
Veröffentlicht: (2022)
A Survey of Multimodal-Guided Image Editing with Text-to-Image Diffusion Models
von: Shuai, Xincheng, et al.
Veröffentlicht: (2024)
von: Shuai, Xincheng, et al.
Veröffentlicht: (2024)
SCORE: Scene Context Matters in Open-Vocabulary Remote Sensing Instance Segmentation
von: Huang, Shiqi, et al.
Veröffentlicht: (2025)
von: Huang, Shiqi, et al.
Veröffentlicht: (2025)
Placing Objects in Context via Inpainting for Out-of-distribution Segmentation
von: de Jorge, Pau, et al.
Veröffentlicht: (2024)
von: de Jorge, Pau, et al.
Veröffentlicht: (2024)
Ähnliche Einträge
-
MeViS: A Multi-Modal Dataset for Referring Motion Expression Video Segmentation
von: Ding, Henghui, et al.
Veröffentlicht: (2025) -
GREx: Generalized Referring Expression Segmentation, Comprehension, and Generation
von: Ding, Henghui, et al.
Veröffentlicht: (2026) -
MOVE: Motion-Guided Few-Shot Video Object Segmentation
von: Ying, Kaining, et al.
Veröffentlicht: (2025) -
Towards Omnimodal Expressions and Reasoning in Referring Audio-Visual Segmentation
von: Ying, Kaining, et al.
Veröffentlicht: (2025) -
SegPoint: Segment Any Point Cloud via Large Language Model
von: He, Shuting, et al.
Veröffentlicht: (2024)