:: Library Catalog

Cover Image

Saved in:

Bibliographic Details
Main Authors:	Willis, Regan, Bakos, Jason
Format:	Preprint
Published:	2025
Subjects:	Machine Learning
Online Access:	https://arxiv.org/abs/2511.21889
Tags:	Add Tag No Tags, Be the first to tag this record!

Similar Items

CrossNAS: A Cross-Layer Neural Architecture Search Framework for PIM Systems
by: Amin, Md Hasibul, et al.
Published: (2025)

A Runtime-Adaptive Transformer Neural Network Accelerator on FPGAs
by: Kabir, Ehsan, et al.
Published: (2024)

Multimodal Health Risk Prediction System for Chronic Diseases via Vision-Language Fusion and Large Language Models
by: Lu, Dingxin, et al.
Published: (2025)

ProTEA: Programmable Transformer Encoder Acceleration on FPGA
by: Kabir, Ehsan, et al.
Published: (2024)

HMVLA: Hyperbolic Multimodal Fusion for Vision-Language-Action Models
by: Wang, Kun, et al.
Published: (2026)

Noise as a Double-Edged Sword: Reinforcement Learning Exploits Randomized Defenses in Neural Networks
by: Bakos, Steve, et al.
Published: (2024)

Exploring Multi-Modality Dynamics: Insights and Challenges in Multimodal Fusion for Biomedical Tasks
by: Wenderoth, Laura
Published: (2024)

BioLangFusion: Multimodal Fusion of DNA, mRNA, and Protein Language Models
by: Mollaysa, Amina, et al.
Published: (2025)

Stabilizing Multimodal Autoencoders: A Theoretical and Empirical Analysis of Fusion Strategies
by: Altinses, Diyar, et al.
Published: (2025)

MGTS-Net: Exploring Graph-Enhanced Multimodal Fusion for Augmented Time Series Forecasting
by: Hao, Shule, et al.
Published: (2025)

Time-VLM: Exploring Multimodal Vision-Language Models for Augmented Time Series Forecasting
by: Zhong, Siru, et al.
Published: (2025)

Multimodal Fusion Strategies for Mapping Biophysical Landscape Features
by: Gordon, Lucia, et al.
Published: (2024)

Multimodal Late Fusion Model for Problem-Solving Strategy Classification in a Machine Learning Game
by: Witt, Clemens, et al.
Published: (2025)

Chunking Strategies for Multimodal AI Systems
by: R, Shashanka B, et al.
Published: (2025)

Federated Vision-Language-Recommendation with Personalized Fusion
by: Li, Zhiwei, et al.
Published: (2024)

Enhancing pretraining efficiency for medical image segmentation via transferability metrics
by: Hidy, Gábor, et al.
Published: (2024)

FAMOUS: Flexible Accelerator for the Attention Mechanism of Transformer on UltraScale+ FPGAs
by: Kabir, Ehsan, et al.
Published: (2024)

Multimodal Representation Learning and Fusion
by: Jin, Qihang, et al.
Published: (2025)

Towards LLM-Centric Multimodal Fusion: A Survey on Integration Strategies and Techniques
by: An, Jisu, et al.
Published: (2025)

Evaluating Open-Source Vision-Language Models for Multimodal Sarcasm Detection
by: Basnet, Saroj, et al.
Published: (2025)

Sparsely Multimodal Data Fusion
by: Bjorgaard, Josiah
Published: (2024)

Tactile Modality Fusion for Vision-Language-Action Models
by: Morissette, Charlotte, et al.
Published: (2026)

Meta Fusion: A Unified Framework For Multimodality Fusion with Mutual Learning
by: Liang, Ziyi, et al.
Published: (2025)

Bridging Language, Vision and Action: Multimodal VAEs in Robotic Manipulation Tasks
by: Sejnova, Gabriela, et al.
Published: (2024)

Optimizing Bidding Strategies in First-Price Auctions in Binary Feedback Setting with Predictions
by: Tandiary, Jason
Published: (2025)

MMed-RAG: Versatile Multimodal RAG System for Medical Vision Language Models
by: Xia, Peng, et al.
Published: (2024)

Exploring Curriculum Learning for Vision-Language Tasks: A Study on Small-Scale Multimodal Training
by: Saha, Rohan, et al.
Published: (2024)

Fusion or Confusion? Multimodal Complexity Is Not All You Need
by: Rheude, Tillmann, et al.
Published: (2025)

Geometry-based Schrödinger Bridges for Trustworthy Multimodal Fusion
by: Xiong, Jiayu, et al.
Published: (2026)

MM-FusionNet: Context-Aware Dynamic Fusion for Multi-modal Fake News Detection with Large Vision-Language Models
by: He, Junhao, et al.
Published: (2025)

Exploring a Multimodal Fusion-based Deep Learning Network for Detecting Facial Palsy
by: Oo, Heng Yim Nicole, et al.
Published: (2024)

Multimodal Fusion at Three Tiers: Physics-Driven Data Generation and Vision-Language Guidance for Brain Tumor Segmentation
by: Zhang, Mingda
Published: (2025)

Feature Alignment Determines Fusion Strategy: A Comparative Study of Cross-Attention and Concatenation in Multimodal Learning
by: Zhou, Zhiqiang, et al.
Published: (2026)

LLM Flow Processes for Text-Conditioned Regression
by: Biggs, Felix, et al.
Published: (2026)

Rethinking Multimodal Fusion for Time Series: Auxiliary Modalities Need Constrained Fusion
by: Lee, Seunghan, et al.
Published: (2026)

Bi-VLA: Bilateral Control-Based Imitation Learning via Vision-Language Fusion for Action Generation
by: Kobayashi, Masato, et al.
Published: (2025)

Robust Multimodal Learning via Entropy-Gated Contrastive Fusion
by: Chlon, Leon, et al.
Published: (2025)

Using LLMs for Late Multimodal Sensor Fusion for Activity Recognition
by: Demirel, Ilker, et al.
Published: (2025)

Multimodal Learning with Uncertainty Quantification based on Discounted Belief Fusion
by: Bezirganyan, Grigor, et al.
Published: (2024)

QIXAI: A Quantum-Inspired Framework for Enhancing Classical and Quantum Model Transparency and Understanding
by: Willis, John M.
Published: (2024)