Salvato in:
| Autori principali: | Jain, Karan, Teli, Mohammad Nayeem |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2025
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2504.10883 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
Improving Deep Generative Models on Many-To-One Image-to-Image Translation
di: Saxena, Sagar, et al.
Pubblicazione: (2024)
di: Saxena, Sagar, et al.
Pubblicazione: (2024)
GCA-ResUNet:Image segmentation in medical images using grouped coordinate attention
di: Ding, Jun, et al.
Pubblicazione: (2025)
di: Ding, Jun, et al.
Pubblicazione: (2025)
TP-UNet: Temporal Prompt Guided UNet for Medical Image Segmentation
di: Wang, Ranmin, et al.
Pubblicazione: (2024)
di: Wang, Ranmin, et al.
Pubblicazione: (2024)
LKM-UNet: Large Kernel Vision Mamba UNet for Medical Image Segmentation
di: Wang, Jinhong, et al.
Pubblicazione: (2024)
di: Wang, Jinhong, et al.
Pubblicazione: (2024)
An Examination of the Compositionality of Large Generative Vision-Language Models
di: Ma, Teli, et al.
Pubblicazione: (2023)
di: Ma, Teli, et al.
Pubblicazione: (2023)
QUEST: A robust attention formulation using query-modulated spherical attention
di: Govindarajan, Hariprasath, et al.
Pubblicazione: (2026)
di: Govindarajan, Hariprasath, et al.
Pubblicazione: (2026)
The Expense of Seeing: Attaining Trustworthy Multimodal Reasoning Within the Monolithic Paradigm
di: Goyal, Karan
Pubblicazione: (2026)
di: Goyal, Karan
Pubblicazione: (2026)
A Heterogeneous Ensemble for Multi-Center COVID-19 Classification from Chest CT Scans
di: Nilay, Aadit, et al.
Pubblicazione: (2026)
di: Nilay, Aadit, et al.
Pubblicazione: (2026)
EPBC-YOLOv8: An efficient and accurate improved YOLOv8 underwater detector based on an attention mechanism
di: Jiang, Xing, et al.
Pubblicazione: (2025)
di: Jiang, Xing, et al.
Pubblicazione: (2025)
KM-UNet KAN Mamba UNet for medical image segmentation
di: Zhang, Yibo
Pubblicazione: (2025)
di: Zhang, Yibo
Pubblicazione: (2025)
Vision Transformer-Conditioned UNet for Domain-Adaptive Semantic Segmentation
di: Ortega, Joel Valdivia, et al.
Pubblicazione: (2026)
di: Ortega, Joel Valdivia, et al.
Pubblicazione: (2026)
Certified Zeroth-order Black-Box Defense with Robust UNet Denoiser
di: Verma, Astha, et al.
Pubblicazione: (2023)
di: Verma, Astha, et al.
Pubblicazione: (2023)
Lost in UNet: Improving Infrared Small Target Detection by Underappreciated Local Features
di: Quan, Wuzhou, et al.
Pubblicazione: (2024)
di: Quan, Wuzhou, et al.
Pubblicazione: (2024)
MM-UNet: A Mixed MLP Architecture for Improved Ophthalmic Image Segmentation
di: Xiao, Zunjie, et al.
Pubblicazione: (2024)
di: Xiao, Zunjie, et al.
Pubblicazione: (2024)
Addressing a fundamental limitation in deep vision models: lack of spatial attention
di: Borji, Ali
Pubblicazione: (2024)
di: Borji, Ali
Pubblicazione: (2024)
MM-UNet: Morph Mamba U-shaped Convolutional Networks for Retinal Vessel Segmentation
di: Liu, Jiawen, et al.
Pubblicazione: (2025)
di: Liu, Jiawen, et al.
Pubblicazione: (2025)
PC-UNet: An Enforcing Poisson Statistics U-Net for Positron Emission Tomography Denoising
di: Shi, Yang, et al.
Pubblicazione: (2025)
di: Shi, Yang, et al.
Pubblicazione: (2025)
FuseUNet: A Multi-Scale Feature Fusion Method for U-like Networks
di: He, Quansong, et al.
Pubblicazione: (2025)
di: He, Quansong, et al.
Pubblicazione: (2025)
RotCAtt-TransUNet++: Novel Deep Neural Network for Sophisticated Cardiac Segmentation
di: Nguyen-Le, Quoc-Bao, et al.
Pubblicazione: (2024)
di: Nguyen-Le, Quoc-Bao, et al.
Pubblicazione: (2024)
GCA-SUNet: A Gated Context-Aware Swin-UNet for Exemplar-Free Counting
di: Wu, Yuzhe, et al.
Pubblicazione: (2024)
di: Wu, Yuzhe, et al.
Pubblicazione: (2024)
Video-SwinUNet: Spatio-temporal Deep Learning Framework for VFSS Instance Segmentation
di: Zeng, Chengxi, et al.
Pubblicazione: (2023)
di: Zeng, Chengxi, et al.
Pubblicazione: (2023)
UNet++ and LSTM combined approach for Breast Ultrasound Image Segmentation
di: Hesaraki, Saba, et al.
Pubblicazione: (2024)
di: Hesaraki, Saba, et al.
Pubblicazione: (2024)
Can you SPLICE it together? A Human Curated Benchmark for Probing Visual Reasoning in VLMs
di: Ballout, Mohamad, et al.
Pubblicazione: (2025)
di: Ballout, Mohamad, et al.
Pubblicazione: (2025)
Visual Object Tracking across Diverse Data Modalities: A Review
di: Wang, Mengmeng, et al.
Pubblicazione: (2024)
di: Wang, Mengmeng, et al.
Pubblicazione: (2024)
MambaLiteUNet: Cross-Gated Adaptive Feature Fusion for Robust Skin Lesion Segmentation
di: Rahman, Md Maklachur, et al.
Pubblicazione: (2026)
di: Rahman, Md Maklachur, et al.
Pubblicazione: (2026)
RynnEC: Bringing MLLMs into Embodied World
di: Dang, Ronghao, et al.
Pubblicazione: (2025)
di: Dang, Ronghao, et al.
Pubblicazione: (2025)
Archaeoscape: Bringing Aerial Laser Scanning Archaeology to the Deep Learning Era
di: Perron, Yohann, et al.
Pubblicazione: (2024)
di: Perron, Yohann, et al.
Pubblicazione: (2024)
Hybrid Dense-UNet201 Optimization for Pap Smear Image Segmentation Using Spider Monkey Optimization
di: Khozaimi, Ach, et al.
Pubblicazione: (2025)
di: Khozaimi, Ach, et al.
Pubblicazione: (2025)
UNetVL: Enhancing 3D Medical Image Segmentation with Chebyshev KAN Powered Vision-LSTM
di: Guo, Xuhui, et al.
Pubblicazione: (2025)
di: Guo, Xuhui, et al.
Pubblicazione: (2025)
SFA-UNet: More Attention to Multi-Scale Contrast and Contextual Information in Infrared Small Object Segmentation
di: Shah, Imad Ali, et al.
Pubblicazione: (2024)
di: Shah, Imad Ali, et al.
Pubblicazione: (2024)
Rethinking Prompt Design for Inference-time Scaling in Text-to-Visual Generation
di: Kim, Subin, et al.
Pubblicazione: (2025)
di: Kim, Subin, et al.
Pubblicazione: (2025)
Bringing Diversity from Diffusion Models to Semantic-Guided Face Asset Generation
di: Cai, Yunxuan, et al.
Pubblicazione: (2025)
di: Cai, Yunxuan, et al.
Pubblicazione: (2025)
Bringing Balance to Hand Shape Classification: Mitigating Data Imbalance Through Generative Models
di: Rios, Gaston Gustavo, et al.
Pubblicazione: (2025)
di: Rios, Gaston Gustavo, et al.
Pubblicazione: (2025)
SmolVLM: Redefining small and efficient multimodal models
di: Marafioti, Andrés, et al.
Pubblicazione: (2025)
di: Marafioti, Andrés, et al.
Pubblicazione: (2025)
A Hybrid Machine Learning Model for Cerebral Palsy Detection
di: Singh, Karan Kumar, et al.
Pubblicazione: (2026)
di: Singh, Karan Kumar, et al.
Pubblicazione: (2026)
Exploring Efficient Foundational Multi-modal Models for Video Summarization
di: Samel, Karan, et al.
Pubblicazione: (2024)
di: Samel, Karan, et al.
Pubblicazione: (2024)
OPENTOUCH: Bringing Full-Hand Touch to Real-World Interaction
di: Song, Yuxin Ray, et al.
Pubblicazione: (2025)
di: Song, Yuxin Ray, et al.
Pubblicazione: (2025)
PersonaTalk: Bring Attention to Your Persona in Visual Dubbing
di: Zhang, Longhao, et al.
Pubblicazione: (2024)
di: Zhang, Longhao, et al.
Pubblicazione: (2024)
GAC-Net_Geometric and attention-based Network for Depth Completion
di: Zhu, Kuang, et al.
Pubblicazione: (2025)
di: Zhu, Kuang, et al.
Pubblicazione: (2025)
Relation Learning and Aggregate-attention for Multi-person Motion Prediction
di: Qu, Kehua, et al.
Pubblicazione: (2024)
di: Qu, Kehua, et al.
Pubblicazione: (2024)
Documenti analoghi
-
Improving Deep Generative Models on Many-To-One Image-to-Image Translation
di: Saxena, Sagar, et al.
Pubblicazione: (2024) -
GCA-ResUNet:Image segmentation in medical images using grouped coordinate attention
di: Ding, Jun, et al.
Pubblicazione: (2025) -
TP-UNet: Temporal Prompt Guided UNet for Medical Image Segmentation
di: Wang, Ranmin, et al.
Pubblicazione: (2024) -
LKM-UNet: Large Kernel Vision Mamba UNet for Medical Image Segmentation
di: Wang, Jinhong, et al.
Pubblicazione: (2024) -
An Examination of the Compositionality of Large Generative Vision-Language Models
di: Ma, Teli, et al.
Pubblicazione: (2023)