Enregistré dans:
| Auteurs principaux: | Sun, Siyuan, Zhang, Yongping, Zeng, Hongcheng, Wang, Yamin, Yang, Wei, Yang, Wanting, Chen, Jie |
|---|---|
| Format: | Preprint |
| Publié: |
2025
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2512.02344 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
Fine-detailed Neural Indoor Scene Reconstruction using multi-level importance sampling and multi-view consistency
par: Li, Xinghui, et autres
Publié: (2024)
par: Li, Xinghui, et autres
Publié: (2024)
Generating visual explanations from deep networks using implicit neural representations
par: Byra, Michal, et autres
Publié: (2025)
par: Byra, Michal, et autres
Publié: (2025)
EyeCLIP: A visual-language foundation model for multi-modal ophthalmic image analysis
par: Shi, Danli, et autres
Publié: (2024)
par: Shi, Danli, et autres
Publié: (2024)
SparseLIF: High-Performance Sparse LiDAR-Camera Fusion for 3D Object Detection
par: Zhang, Hongcheng, et autres
Publié: (2024)
par: Zhang, Hongcheng, et autres
Publié: (2024)
SCE-LITE-HQ: Smooth visual counterfactual explanations with generative foundation models
par: Zeid, Ahmed, et autres
Publié: (2026)
par: Zeid, Ahmed, et autres
Publié: (2026)
InteractAnything: Zero-shot Human Object Interaction Synthesis via LLM Feedback and Object Affordance Parsing
par: Zhang, Jinlu, et autres
Publié: (2025)
par: Zhang, Jinlu, et autres
Publié: (2025)
BAT: Learning Event-based Optical Flow with Bidirectional Adaptive Temporal Correlation
par: Xu, Gangwei, et autres
Publié: (2025)
par: Xu, Gangwei, et autres
Publié: (2025)
Direction-aware multi-scale gradient loss for infrared and visible image fusion
par: Yang, Kaixuan, et autres
Publié: (2025)
par: Yang, Kaixuan, et autres
Publié: (2025)
Robust multi-coil MRI reconstruction via self-supervised denoising
par: Aali, Asad, et autres
Publié: (2024)
par: Aali, Asad, et autres
Publié: (2024)
Zero-shot sketch-based remote sensing image retrieval based on multi-level and attention-guided tokenization
par: Yang, Bo, et autres
Publié: (2024)
par: Yang, Bo, et autres
Publié: (2024)
SAR image matching algorithm based on multi-class features
par: Qiang, Mazhi, et autres
Publié: (2021)
par: Qiang, Mazhi, et autres
Publié: (2021)
Enhancing image quality prediction with self-supervised visual masking
par: Çoğalan, Uğur, et autres
Publié: (2023)
par: Çoğalan, Uğur, et autres
Publié: (2023)
CMViM: Contrastive Masked Vim Autoencoder for 3D Multi-modal Representation Learning for AD classification
par: Yang, Guangqian, et autres
Publié: (2024)
par: Yang, Guangqian, et autres
Publié: (2024)
Progressive trajectory matching for medical dataset distillation
par: Yu, Zhen, et autres
Publié: (2024)
par: Yu, Zhen, et autres
Publié: (2024)
PhysLab: A Benchmark Dataset for Multi-Granularity Visual Parsing of Physics Experiments
par: Zou, Minghao, et autres
Publié: (2025)
par: Zou, Minghao, et autres
Publié: (2025)
An annotated grain kernel image database for visual quality inspection
par: Fan, Lei, et autres
Publié: (2023)
par: Fan, Lei, et autres
Publié: (2023)
Post-hoc and manifold explanations analysis of facial expression data based on deep learning
par: Xiao, Yang
Publié: (2024)
par: Xiao, Yang
Publié: (2024)
F-HOI: Toward Fine-grained Semantic-Aligned 3D Human-Object Interactions
par: Yang, Jie, et autres
Publié: (2024)
par: Yang, Jie, et autres
Publié: (2024)
CNN-based explanation ensembling for dataset, representation and explanations evaluation
par: Hryniewska-Guzik, Weronika, et autres
Publié: (2024)
par: Hryniewska-Guzik, Weronika, et autres
Publié: (2024)
Looking in the mirror: A faithful counterfactual explanation method for interpreting deep image classification models
par: Chowdhury, Townim Faisal, et autres
Publié: (2025)
par: Chowdhury, Townim Faisal, et autres
Publié: (2025)
Efficient feature matching for UAV images based on compact GPU data scheduling
par: Jiang, San, et autres
Publié: (2025)
par: Jiang, San, et autres
Publié: (2025)
UETrack: A Unified and Efficient Framework for Single Object Tracking
par: Kang, Ben, et autres
Publié: (2026)
par: Kang, Ben, et autres
Publié: (2026)
Pixel-Perfect Visual Geometry Estimation
par: Xu, Gangwei, et autres
Publié: (2026)
par: Xu, Gangwei, et autres
Publié: (2026)
Single image super-resolution based on trainable feature matching attention network
par: Chen, Qizhou, et autres
Publié: (2024)
par: Chen, Qizhou, et autres
Publié: (2024)
video-SALMONN-o1: Reasoning-enhanced Audio-visual Large Language Model
par: Sun, Guangzhi, et autres
Publié: (2025)
par: Sun, Guangzhi, et autres
Publié: (2025)
Breast tumor classification based on self-supervised contrastive learning from ultrasound videos
par: Tang, Yunxin, et autres
Publié: (2024)
par: Tang, Yunxin, et autres
Publié: (2024)
Multi-view learning for automatic classification of multi-wavelength auroral images
par: Yang, Qiuju, et autres
Publié: (2023)
par: Yang, Qiuju, et autres
Publié: (2023)
2DGS-Room: Seed-Guided 2D Gaussian Splatting with Geometric Constrains for High-Fidelity Indoor Scene Reconstruction
par: Zhang, Wanting, et autres
Publié: (2024)
par: Zhang, Wanting, et autres
Publié: (2024)
X-Pose: Detecting Any Keypoints
par: Yang, Jie, et autres
Publié: (2023)
par: Yang, Jie, et autres
Publié: (2023)
Thyroid ultrasound diagnosis improvement via multi-view self-supervised learning and two-stage pre-training
par: Wang, Jian, et autres
Publié: (2024)
par: Wang, Jian, et autres
Publié: (2024)
Affine transformation estimation improves visual self-supervised learning
par: Torpey, David, et autres
Publié: (2024)
par: Torpey, David, et autres
Publié: (2024)
Surgical Depth Anything: Depth Estimation for Surgical Scenes using Foundation Models
par: Lou, Ange, et autres
Publié: (2024)
par: Lou, Ange, et autres
Publié: (2024)
QuadBox: Accelerating 3D Gaussian Splatting with Geometry-Aware Boxes
par: Li, Xinze, et autres
Publié: (2026)
par: Li, Xinze, et autres
Publié: (2026)
3MOS: Multi-sources, Multi-resolutions, and Multi-scenes dataset for Optical-SAR image matching
par: Ye, Yibin, et autres
Publié: (2024)
par: Ye, Yibin, et autres
Publié: (2024)
End-to-end multi-modal product matching in fashion e-commerce
par: Tóth, Sándor, et autres
Publié: (2024)
par: Tóth, Sándor, et autres
Publié: (2024)
Aligned explanations in neural networks
par: Lobet, Corentin, et autres
Publié: (2026)
par: Lobet, Corentin, et autres
Publié: (2026)
PointForward: Feedforward Driving Reconstruction through Point-Aligned Representations
par: Chi, Cheng, et autres
Publié: (2026)
par: Chi, Cheng, et autres
Publié: (2026)
AVS-Net: Point Sampling with Adaptive Voxel Size for 3D Scene Understanding
par: Yang, Hongcheng, et autres
Publié: (2024)
par: Yang, Hongcheng, et autres
Publié: (2024)
CMI-MTL: Cross-Mamba interaction based multi-task learning for medical visual question answering
par: Jin, Qiangguo, et autres
Publié: (2025)
par: Jin, Qiangguo, et autres
Publié: (2025)
A multimodal slice discovery framework for systematic failure detection and explanation in medical image classification
par: Liu, Yixuan, et autres
Publié: (2026)
par: Liu, Yixuan, et autres
Publié: (2026)
Documents similaires
-
Fine-detailed Neural Indoor Scene Reconstruction using multi-level importance sampling and multi-view consistency
par: Li, Xinghui, et autres
Publié: (2024) -
Generating visual explanations from deep networks using implicit neural representations
par: Byra, Michal, et autres
Publié: (2025) -
EyeCLIP: A visual-language foundation model for multi-modal ophthalmic image analysis
par: Shi, Danli, et autres
Publié: (2024) -
SparseLIF: High-Performance Sparse LiDAR-Camera Fusion for 3D Object Detection
par: Zhang, Hongcheng, et autres
Publié: (2024) -
SCE-LITE-HQ: Smooth visual counterfactual explanations with generative foundation models
par: Zeid, Ahmed, et autres
Publié: (2026)