:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autori principali:	Gholamzadeh, Ali, Sajid, Noor
Natura:	Preprint
Pubblicazione:	2025
Soggetti:	Machine Learning Computer Vision and Pattern Recognition
Accesso online:	https://arxiv.org/abs/2505.12322
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

Can multimodal representation learning by alignment preserve modality-specific information?
di: Thoreau, Romain, et al.
Pubblicazione: (2025)

Domain Generalization through Meta-Learning: A Survey
di: Khoee, Arsham Gholamzadeh, et al.
Pubblicazione: (2024)

The problems with using STNs to align CNN feature maps
di: Finnveden, Lukas, et al.
Pubblicazione: (2020)

AGA: An adaptive group alignment framework for structured medical cross-modal representation learning
di: Li, Wei, et al.
Pubblicazione: (2025)

Video alignment using unsupervised learning of local and global features
di: Fakhfour, Niloufar, et al.
Pubblicazione: (2023)

CLIP Behaves like a Bag-of-Words Model Cross-modally but not Uni-modally
di: Koishigarina, Darina, et al.
Pubblicazione: (2025)

Cross-modal Affinity-aligned Multimodal Learning Analytics for Predicting Student Collaboration Satisfaction in Game-Based Learning
di: Tsai, Wen-Hsin, et al.
Pubblicazione: (2026)

EaqVLA: Encoding-aligned Quantization for Vision-Language-Action Models
di: Jiang, Feng, et al.
Pubblicazione: (2025)

LayerSync: Self-aligning Intermediate Layers
di: Haghighi, Yasaman, et al.
Pubblicazione: (2025)

Closing the gap in multimodal medical representation alignment
di: Grassucci, Eleonora, et al.
Pubblicazione: (2026)

Concepts or Skills? Rethinking Instruction Selection for Multi-modal Models
di: Bai, Andrew, et al.
Pubblicazione: (2025)

Learnable Cross-modal Knowledge Distillation for Multi-modal Learning with Missing Modality
di: Wang, Hu, et al.
Pubblicazione: (2023)

Aided design of bridge aesthetics based on Stable Diffusion fine-tuning
di: Zhang, Leye, et al.
Pubblicazione: (2024)

Sparse components distinguish visual pathways & their alignment to neural networks
di: Marvi, Ammar I, et al.
Pubblicazione: (2025)

Multi-modal Data Binding for Survival Analysis Modeling with Incomplete Data and Annotations
di: Qu, Linhao, et al.
Pubblicazione: (2024)

CFM: Language-aligned Concept Foundation Model for Vision
di: Wittenmayer, Kai, et al.
Pubblicazione: (2026)

Color Recognition in Challenging Lighting Environments: CNN Approach
di: Maitlo, Nizamuddin, et al.
Pubblicazione: (2024)

Self-supervised video pretraining yields robust and more human-aligned visual representations
di: Parthasarathy, Nikhil, et al.
Pubblicazione: (2022)

Multi-modal Data Spectrum: Multi-modal Datasets are Multi-dimensional
di: Madaan, Divyam, et al.
Pubblicazione: (2025)

Multi-modal Representation Learning for Cross-modal Prediction of Continuous Weather Patterns from Discrete Low-Dimensional Data
di: Qayyum, Alif Bin Abdul, et al.
Pubblicazione: (2024)

Multi-level and Multi-modal Action Anticipation
di: Kim, Seulgi, et al.
Pubblicazione: (2025)

Towards Multi-modal Transformers in Federated Learning
di: Sun, Guangyu, et al.
Pubblicazione: (2024)

Multi-modal learning for geospatial vegetation forecasting
di: Benson, Vitus, et al.
Pubblicazione: (2023)

On the Multi-modal Vulnerability of Diffusion Models
di: Yang, Dingcheng, et al.
Pubblicazione: (2024)

Bridging Modalities via Progressive Re-alignment for Multimodal Test-Time Adaptation
di: Li, Jiacheng, et al.
Pubblicazione: (2025)

Supersampling Stable Diffusion and Beyond: A Seamless, Training-Free Approach for Scaling Neural Networks Using Common Interpolation Methods
di: Zishan, Md Abu Obaida, et al.
Pubblicazione: (2026)

TWINGS: Thin Plate Splines Warp-aligned Initialization for Sparse-View Gaussian Splatting
di: Kim, Hyeseong, et al.
Pubblicazione: (2026)

cadrille: Multi-modal CAD Reconstruction with Reinforcement Learning
di: Kolodiazhnyi, Maksim, et al.
Pubblicazione: (2025)

Multi-level Cross-modal Alignment for Image Clustering
di: Qiu, Liping, et al.
Pubblicazione: (2024)

Retinal Disease Classification from Fundus Images using CNN Transfer Learning
di: Akram, Ali
Pubblicazione: (2026)

Jointly Modeling Inter- & Intra-Modality Dependencies for Multi-modal Learning
di: Madaan, Divyam, et al.
Pubblicazione: (2024)

Coreset selection based on Intra-class diversity
di: Ashraf, Imran, et al.
Pubblicazione: (2025)

ReLayout: Integrating Relation Reasoning for Content-aware Layout Generation with Multi-modal Large Language Models
di: Tian, Jiaxu, et al.
Pubblicazione: (2025)

OV-HHIR: Open Vocabulary Human Interaction Recognition Using Cross-modal Integration of Large Language Models
di: Ray, Lala Shakti Swarup, et al.
Pubblicazione: (2024)

Delving into Multi-modal Multi-task Foundation Models for Road Scene Understanding: From Learning Paradigm Perspectives
di: Luo, Sheng, et al.
Pubblicazione: (2024)

PM2: A New Prompting Multi-modal Model Paradigm for Few-shot Medical Image Classification
di: Wang, Zhenwei, et al.
Pubblicazione: (2024)

Cross-modal Active Complementary Learning with Self-refining Correspondence
di: Qin, Yang, et al.
Pubblicazione: (2023)

Improving Medical Multi-modal Contrastive Learning with Expert Annotations
di: Kumar, Yogesh, et al.
Pubblicazione: (2024)

Multi-modal Co-learning for Earth Observation: Enhancing single-modality models via modality collaboration
di: Mena, Francisco, et al.
Pubblicazione: (2025)

iNeMo: Incremental Neural Mesh Models for Robust Class-Incremental Learning
di: Fischer, Tom, et al.
Pubblicazione: (2024)