Vista Equipo: :: Library Catalog

Guardado en:

Detalles Bibliográficos
Autores principales:	Mariotti, Octave, Du, Zhipeng, Bhalgat, Yash, Mac Aodha, Oisin, Bilen, Hakan
Formato:	Preprint
Publicado:	2025
Materias:	Computer Vision and Pattern Recognition
Acceso en línea:	https://arxiv.org/abs/2506.08220
Etiquetas:	Agregar Etiqueta Sin Etiquetas, Sea el primero en etiquetar este registro!

_version_	1866915611459715072
author	Mariotti, Octave Du, Zhipeng Bhalgat, Yash Mac Aodha, Oisin Bilen, Hakan
author_facet	Mariotti, Octave Du, Zhipeng Bhalgat, Yash Mac Aodha, Oisin Bilen, Hakan
contents	Semantic correspondence (SC) aims to establish semantically meaningful matches across different instances of an object category. We illustrate how recent supervised SC methods remain limited in their ability to generalize beyond sparsely annotated training keypoints, effectively acting as keypoint detectors. To address this, we propose a novel approach for learning dense correspondences by lifting 2D keypoints into a canonical 3D space using monocular depth estimation. Our method constructs a continuous canonical manifold that captures object geometry without requiring explicit 3D supervision or camera annotations. Additionally, we introduce SPair-U, an extension of SPair-71k with novel keypoint annotations, to better assess generalization. Experiments not only demonstrate that our model significantly outperforms supervised baselines on unseen keypoints, highlighting its effectiveness in learning robust correspondences, but that unsupervised baselines outperform supervised counterparts when generalized across different datasets.
format	Preprint
id	arxiv_https___arxiv_org_abs_2506_08220
institution	arXiv
publishDate	2025
record_format	arxiv
spellingShingle	Jamais Vu: Exposing the Generalization Gap in Supervised Semantic Correspondence Mariotti, Octave Du, Zhipeng Bhalgat, Yash Mac Aodha, Oisin Bilen, Hakan Computer Vision and Pattern Recognition Semantic correspondence (SC) aims to establish semantically meaningful matches across different instances of an object category. We illustrate how recent supervised SC methods remain limited in their ability to generalize beyond sparsely annotated training keypoints, effectively acting as keypoint detectors. To address this, we propose a novel approach for learning dense correspondences by lifting 2D keypoints into a canonical 3D space using monocular depth estimation. Our method constructs a continuous canonical manifold that captures object geometry without requiring explicit 3D supervision or camera annotations. Additionally, we introduce SPair-U, an extension of SPair-71k with novel keypoint annotations, to better assess generalization. Experiments not only demonstrate that our model significantly outperforms supervised baselines on unseen keypoints, highlighting its effectiveness in learning robust correspondences, but that unsupervised baselines outperform supervised counterparts when generalized across different datasets.
title	Jamais Vu: Exposing the Generalization Gap in Supervised Semantic Correspondence
topic	Computer Vision and Pattern Recognition
url	https://arxiv.org/abs/2506.08220

Ejemplares similares