:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autori principali:	Jain, Karan, Teli, Mohammad Nayeem
Natura:	Preprint
Pubblicazione:	2025
Soggetti:	Computer Vision and Pattern Recognition Artificial Intelligence
Accesso online:	https://arxiv.org/abs/2504.10883
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

Improving Deep Generative Models on Many-To-One Image-to-Image Translation
di: Saxena, Sagar, et al.
Pubblicazione: (2024)

GCA-ResUNet:Image segmentation in medical images using grouped coordinate attention
di: Ding, Jun, et al.
Pubblicazione: (2025)

TP-UNet: Temporal Prompt Guided UNet for Medical Image Segmentation
di: Wang, Ranmin, et al.
Pubblicazione: (2024)

LKM-UNet: Large Kernel Vision Mamba UNet for Medical Image Segmentation
di: Wang, Jinhong, et al.
Pubblicazione: (2024)

An Examination of the Compositionality of Large Generative Vision-Language Models
di: Ma, Teli, et al.
Pubblicazione: (2023)

QUEST: A robust attention formulation using query-modulated spherical attention
di: Govindarajan, Hariprasath, et al.
Pubblicazione: (2026)

The Expense of Seeing: Attaining Trustworthy Multimodal Reasoning Within the Monolithic Paradigm
di: Goyal, Karan
Pubblicazione: (2026)

A Heterogeneous Ensemble for Multi-Center COVID-19 Classification from Chest CT Scans
di: Nilay, Aadit, et al.
Pubblicazione: (2026)

EPBC-YOLOv8: An efficient and accurate improved YOLOv8 underwater detector based on an attention mechanism
di: Jiang, Xing, et al.
Pubblicazione: (2025)

KM-UNet KAN Mamba UNet for medical image segmentation
di: Zhang, Yibo
Pubblicazione: (2025)

Vision Transformer-Conditioned UNet for Domain-Adaptive Semantic Segmentation
di: Ortega, Joel Valdivia, et al.
Pubblicazione: (2026)

Certified Zeroth-order Black-Box Defense with Robust UNet Denoiser
di: Verma, Astha, et al.
Pubblicazione: (2023)

Lost in UNet: Improving Infrared Small Target Detection by Underappreciated Local Features
di: Quan, Wuzhou, et al.
Pubblicazione: (2024)

MM-UNet: A Mixed MLP Architecture for Improved Ophthalmic Image Segmentation
di: Xiao, Zunjie, et al.
Pubblicazione: (2024)

Addressing a fundamental limitation in deep vision models: lack of spatial attention
di: Borji, Ali
Pubblicazione: (2024)

MM-UNet: Morph Mamba U-shaped Convolutional Networks for Retinal Vessel Segmentation
di: Liu, Jiawen, et al.
Pubblicazione: (2025)

PC-UNet: An Enforcing Poisson Statistics U-Net for Positron Emission Tomography Denoising
di: Shi, Yang, et al.
Pubblicazione: (2025)

FuseUNet: A Multi-Scale Feature Fusion Method for U-like Networks
di: He, Quansong, et al.
Pubblicazione: (2025)

RotCAtt-TransUNet++: Novel Deep Neural Network for Sophisticated Cardiac Segmentation
di: Nguyen-Le, Quoc-Bao, et al.
Pubblicazione: (2024)

GCA-SUNet: A Gated Context-Aware Swin-UNet for Exemplar-Free Counting
di: Wu, Yuzhe, et al.
Pubblicazione: (2024)

Video-SwinUNet: Spatio-temporal Deep Learning Framework for VFSS Instance Segmentation
di: Zeng, Chengxi, et al.
Pubblicazione: (2023)

UNet++ and LSTM combined approach for Breast Ultrasound Image Segmentation
di: Hesaraki, Saba, et al.
Pubblicazione: (2024)

Can you SPLICE it together? A Human Curated Benchmark for Probing Visual Reasoning in VLMs
di: Ballout, Mohamad, et al.
Pubblicazione: (2025)

Visual Object Tracking across Diverse Data Modalities: A Review
di: Wang, Mengmeng, et al.
Pubblicazione: (2024)

MambaLiteUNet: Cross-Gated Adaptive Feature Fusion for Robust Skin Lesion Segmentation
di: Rahman, Md Maklachur, et al.
Pubblicazione: (2026)

RynnEC: Bringing MLLMs into Embodied World
di: Dang, Ronghao, et al.
Pubblicazione: (2025)

Archaeoscape: Bringing Aerial Laser Scanning Archaeology to the Deep Learning Era
di: Perron, Yohann, et al.
Pubblicazione: (2024)

Hybrid Dense-UNet201 Optimization for Pap Smear Image Segmentation Using Spider Monkey Optimization
di: Khozaimi, Ach, et al.
Pubblicazione: (2025)

UNetVL: Enhancing 3D Medical Image Segmentation with Chebyshev KAN Powered Vision-LSTM
di: Guo, Xuhui, et al.
Pubblicazione: (2025)

SFA-UNet: More Attention to Multi-Scale Contrast and Contextual Information in Infrared Small Object Segmentation
di: Shah, Imad Ali, et al.
Pubblicazione: (2024)

Rethinking Prompt Design for Inference-time Scaling in Text-to-Visual Generation
di: Kim, Subin, et al.
Pubblicazione: (2025)

Bringing Diversity from Diffusion Models to Semantic-Guided Face Asset Generation
di: Cai, Yunxuan, et al.
Pubblicazione: (2025)

Bringing Balance to Hand Shape Classification: Mitigating Data Imbalance Through Generative Models
di: Rios, Gaston Gustavo, et al.
Pubblicazione: (2025)

SmolVLM: Redefining small and efficient multimodal models
di: Marafioti, Andrés, et al.
Pubblicazione: (2025)

A Hybrid Machine Learning Model for Cerebral Palsy Detection
di: Singh, Karan Kumar, et al.
Pubblicazione: (2026)

Exploring Efficient Foundational Multi-modal Models for Video Summarization
di: Samel, Karan, et al.
Pubblicazione: (2024)

OPENTOUCH: Bringing Full-Hand Touch to Real-World Interaction
di: Song, Yuxin Ray, et al.
Pubblicazione: (2025)

PersonaTalk: Bring Attention to Your Persona in Visual Dubbing
di: Zhang, Longhao, et al.
Pubblicazione: (2024)

GAC-Net_Geometric and attention-based Network for Depth Completion
di: Zhu, Kuang, et al.
Pubblicazione: (2025)

Relation Learning and Aggregate-attention for Multi-person Motion Prediction
di: Qu, Kehua, et al.
Pubblicazione: (2024)