:: Library Catalog

Cover Image

Saved in:

Bibliographic Details
Main Authors:	Dagdilelis, Dimitrios, Grigoriadis, Panagiotis, Galeazzi, Roberto
Format:	Preprint
Published:	2025
Subjects:	Computer Vision and Pattern Recognition Artificial Intelligence
Online Access:	https://arxiv.org/abs/2505.01615
Tags:	Add Tag No Tags, Be the first to tag this record!

Similar Items

The More, the Merrier: Contrastive Fusion for Higher-Order Multimodal Alignment
by: Koutoupis, Stefanos, et al.
Published: (2025)

Self-Supervised Multiview Xray Matching
by: Dabboussi, Mohamad, et al.
Published: (2025)

FLEX: A Largescale Multimodal, Multiview Dataset for Learning Structured Representations for Fitness Action Quality Assessment
by: Yin, Hao, et al.
Published: (2025)

Application of Multimodal Fusion Deep Learning Model in Disease Recognition
by: Liu, Xiaoyi, et al.
Published: (2024)

MV-RAG: Retrieval Augmented Multiview Diffusion
by: Dayani, Yosef, et al.
Published: (2025)

Autonomous Embodied Agents: When Robotics Meets Deep Learning Reasoning
by: Bigazzi, Roberto
Published: (2025)

Controllable Video Object Insertion via Multiview Priors
by: Qi, Xia, et al.
Published: (2026)

VLM-E2E: Enhancing End-to-End Autonomous Driving with Multimodal Driver Attention Fusion
by: Liu, Pei, et al.
Published: (2025)

Fossil Image Identification using Deep Learning Ensembles of Data Augmented Multiviews
by: Hou, Chengbin, et al.
Published: (2023)

DINO-CVA: A Multimodal Goal-Conditioned Vision-to-Action Model for Autonomous Catheter Navigation
by: Fekri, Pedram, et al.
Published: (2025)

MEAT: Multiview Diffusion Model for Human Generation on Megapixels with Mesh Attention
by: Wang, Yuhan, et al.
Published: (2025)

Mitigating Hallucinations on Object Attributes using Multiview Images and Negative Instructions
by: Tan, Zhijie, et al.
Published: (2025)

BioFusionNet: Deep Learning-Based Survival Risk Stratification in ER+ Breast Cancer Through Multifeature and Multimodal Data Fusion
by: Mondol, Raktim Kumar, et al.
Published: (2024)

Solving Scene Understanding for Autonomous Navigation in Unstructured Environments
by: Renji, Naveen Mathews, et al.
Published: (2025)

Multimodal Fusion SLAM with Fourier Attention
by: Zhou, Youjie, et al.
Published: (2025)

Fusion to Enhance: Fusion Visual Encoder to Enhance Multimodal Language Model
by: She, Yifei, et al.
Published: (2025)

Dynamic Multi-Target Fusion for Efficient Audio-Visual Navigation
by: Yu, Yinfeng, et al.
Published: (2025)

DeepIPCv2: LiDAR-powered Robust Environmental Perception and Navigational Control for Autonomous Vehicle
by: Natan, Oskar, et al.
Published: (2023)

1st Place Solution of Multiview Egocentric Hand Tracking Challenge ECCV2024
by: Zou, Minqiang, et al.
Published: (2024)

MM-SurvNet: Deep Learning-Based Survival Risk Stratification in Breast Cancer Through Multimodal Data Fusion
by: Mondol, Raktim Kumar, et al.
Published: (2024)

Argus: Leveraging Multiview Images for Improved 3-D Scene Understanding With Large Language Models
by: Xu, Yifan, et al.
Published: (2025)

Autonomous AI Surveillance: Multimodal Deep Learning for Cognitive and Behavioral Monitoring
by: Hamza, Ameer, et al.
Published: (2025)

DeepAgent: A Dual Stream Multi Agent Fusion for Robust Multimodal Deepfake Detection
by: Zaman, Sayeem Been, et al.
Published: (2025)

Reasoning-Aware Multimodal Fusion for Hateful Video Detection
by: Yang, Shuonan, et al.
Published: (2025)

Understanding vs. Generation: Navigating Optimization Dilemma in Multimodal Models
by: Ye, Sen, et al.
Published: (2026)

Dragen3D: Multiview Geometry Consistent 3D Gaussian Generation with Drag-Based Control
by: Yan, Jinbo, et al.
Published: (2025)

Deep Learning in Cardiology
by: Bizopoulos, Paschalis, et al.
Published: (2019)

Advances in Diffusion Models for Image Data Augmentation: A Review of Methods, Models, Evaluation Metrics and Future Research Directions
by: Alimisis, Panagiotis, et al.
Published: (2024)

Agentic Pipeline for Self-Synchronized Multiview Joint Angle Monitoring in Uncalibrated Environments
by: Yu, Juncheng, et al.
Published: (2026)

A Multimodal Hybrid Late-Cascade Fusion Network for Enhanced 3D Object Detection
by: Sgaravatti, Carlo, et al.
Published: (2025)

Uncertainty-Encoded Multi-Modal Fusion for Robust Object Detection in Autonomous Driving
by: Lou, Yang, et al.
Published: (2023)

Timely Fusion of Surround Radar/Lidar for Object Detection in Autonomous Driving Systems
by: Xie, Wenjing, et al.
Published: (2023)

Residual Cross-Modal Fusion Networks for Audio-Visual Navigation
by: Wang, Yi, et al.
Published: (2026)

Pedestrian Crossing Intention Prediction Using Multimodal Fusion Network
by: Li, Yuanzhe, et al.
Published: (2025)

Rethinking Normalization Strategies and Convolutional Kernels for Multimodal Image Fusion
by: He, Dan, et al.
Published: (2024)

Enhancing Perception Capabilities of Multimodal LLMs with Training-Free Fusion
by: Chen, Zhuokun, et al.
Published: (2024)

Text-Guided Layer Fusion Mitigates Hallucination in Multimodal LLMs
by: Lin, Chenchen, et al.
Published: (2026)

Adaptive Diffusion Terrain Generator for Autonomous Uneven Terrain Navigation
by: Yu, Youwei, et al.
Published: (2024)

URMF: Uncertainty-aware Robust Multimodal Fusion for Multimodal Sarcasm Detection
by: Wang, Zhenyu, et al.
Published: (2026)

SyncDreamer: Generating Multiview-consistent Images from a Single-view Image
by: Liu, Yuan, et al.
Published: (2023)