:: Library Catalog

Image de couverture de livre

Enregistré dans:

Détails bibliographiques
Auteurs principaux:	Sun, Siyuan, Zhang, Yongping, Zeng, Hongcheng, Wang, Yamin, Yang, Wei, Yang, Wanting, Chen, Jie
Format:	Preprint
Publié:	2025
Sujets:	Computer Vision and Pattern Recognition
Accès en ligne:	https://arxiv.org/abs/2512.02344
Tags:	Ajouter un tag Pas de tags, Soyez le premier à ajouter un tag!

Documents similaires

Fine-detailed Neural Indoor Scene Reconstruction using multi-level importance sampling and multi-view consistency
par: Li, Xinghui, et autres
Publié: (2024)

Generating visual explanations from deep networks using implicit neural representations
par: Byra, Michal, et autres
Publié: (2025)

EyeCLIP: A visual-language foundation model for multi-modal ophthalmic image analysis
par: Shi, Danli, et autres
Publié: (2024)

SparseLIF: High-Performance Sparse LiDAR-Camera Fusion for 3D Object Detection
par: Zhang, Hongcheng, et autres
Publié: (2024)

SCE-LITE-HQ: Smooth visual counterfactual explanations with generative foundation models
par: Zeid, Ahmed, et autres
Publié: (2026)

InteractAnything: Zero-shot Human Object Interaction Synthesis via LLM Feedback and Object Affordance Parsing
par: Zhang, Jinlu, et autres
Publié: (2025)

BAT: Learning Event-based Optical Flow with Bidirectional Adaptive Temporal Correlation
par: Xu, Gangwei, et autres
Publié: (2025)

Direction-aware multi-scale gradient loss for infrared and visible image fusion
par: Yang, Kaixuan, et autres
Publié: (2025)

Robust multi-coil MRI reconstruction via self-supervised denoising
par: Aali, Asad, et autres
Publié: (2024)

Zero-shot sketch-based remote sensing image retrieval based on multi-level and attention-guided tokenization
par: Yang, Bo, et autres
Publié: (2024)

SAR image matching algorithm based on multi-class features
par: Qiang, Mazhi, et autres
Publié: (2021)

Enhancing image quality prediction with self-supervised visual masking
par: Çoğalan, Uğur, et autres
Publié: (2023)

CMViM: Contrastive Masked Vim Autoencoder for 3D Multi-modal Representation Learning for AD classification
par: Yang, Guangqian, et autres
Publié: (2024)

Progressive trajectory matching for medical dataset distillation
par: Yu, Zhen, et autres
Publié: (2024)

PhysLab: A Benchmark Dataset for Multi-Granularity Visual Parsing of Physics Experiments
par: Zou, Minghao, et autres
Publié: (2025)

An annotated grain kernel image database for visual quality inspection
par: Fan, Lei, et autres
Publié: (2023)

Post-hoc and manifold explanations analysis of facial expression data based on deep learning
par: Xiao, Yang
Publié: (2024)

F-HOI: Toward Fine-grained Semantic-Aligned 3D Human-Object Interactions
par: Yang, Jie, et autres
Publié: (2024)

CNN-based explanation ensembling for dataset, representation and explanations evaluation
par: Hryniewska-Guzik, Weronika, et autres
Publié: (2024)

Looking in the mirror: A faithful counterfactual explanation method for interpreting deep image classification models
par: Chowdhury, Townim Faisal, et autres
Publié: (2025)

Efficient feature matching for UAV images based on compact GPU data scheduling
par: Jiang, San, et autres
Publié: (2025)

UETrack: A Unified and Efficient Framework for Single Object Tracking
par: Kang, Ben, et autres
Publié: (2026)

Pixel-Perfect Visual Geometry Estimation
par: Xu, Gangwei, et autres
Publié: (2026)

Single image super-resolution based on trainable feature matching attention network
par: Chen, Qizhou, et autres
Publié: (2024)

video-SALMONN-o1: Reasoning-enhanced Audio-visual Large Language Model
par: Sun, Guangzhi, et autres
Publié: (2025)

Breast tumor classification based on self-supervised contrastive learning from ultrasound videos
par: Tang, Yunxin, et autres
Publié: (2024)

Multi-view learning for automatic classification of multi-wavelength auroral images
par: Yang, Qiuju, et autres
Publié: (2023)

2DGS-Room: Seed-Guided 2D Gaussian Splatting with Geometric Constrains for High-Fidelity Indoor Scene Reconstruction
par: Zhang, Wanting, et autres
Publié: (2024)

X-Pose: Detecting Any Keypoints
par: Yang, Jie, et autres
Publié: (2023)

Thyroid ultrasound diagnosis improvement via multi-view self-supervised learning and two-stage pre-training
par: Wang, Jian, et autres
Publié: (2024)

Affine transformation estimation improves visual self-supervised learning
par: Torpey, David, et autres
Publié: (2024)

Surgical Depth Anything: Depth Estimation for Surgical Scenes using Foundation Models
par: Lou, Ange, et autres
Publié: (2024)

QuadBox: Accelerating 3D Gaussian Splatting with Geometry-Aware Boxes
par: Li, Xinze, et autres
Publié: (2026)

3MOS: Multi-sources, Multi-resolutions, and Multi-scenes dataset for Optical-SAR image matching
par: Ye, Yibin, et autres
Publié: (2024)

End-to-end multi-modal product matching in fashion e-commerce
par: Tóth, Sándor, et autres
Publié: (2024)

Aligned explanations in neural networks
par: Lobet, Corentin, et autres
Publié: (2026)

PointForward: Feedforward Driving Reconstruction through Point-Aligned Representations
par: Chi, Cheng, et autres
Publié: (2026)

AVS-Net: Point Sampling with Adaptive Voxel Size for 3D Scene Understanding
par: Yang, Hongcheng, et autres
Publié: (2024)

CMI-MTL: Cross-Mamba interaction based multi-task learning for medical visual question answering
par: Jin, Qiangguo, et autres
Publié: (2025)

A multimodal slice discovery framework for systematic failure detection and explanation in medical image classification
par: Liu, Yixuan, et autres
Publié: (2026)