:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autori principali:	Jing, Liu, Rahman, Amirul
Natura:	Preprint
Pubblicazione:	2024
Soggetti:	Computer Vision and Pattern Recognition
Accesso online:	https://arxiv.org/abs/2412.09870
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

Elevating Visual Question Answering through Implicitly Learned Reasoning Pathways in LVLMs
di: Jing, Liu, et al.
Pubblicazione: (2025)

Cross-Modal Scene Semantic Alignment for Image Complexity Assessment
di: Luo, Yuqing, et al.
Pubblicazione: (2025)

MPCAR: Multi-Perspective Contextual Augmentation for Enhanced Visual Reasoning in Large Vision-Language Models
di: Rahman, Amirul, et al.
Pubblicazione: (2025)

Enhancing CLIP Robustness via Cross-Modality Alignment
di: Zhu, Xingyu, et al.
Pubblicazione: (2025)

Semantic-Enhanced Cross-Modal Place Recognition for Robust Robot Localization
di: Lin, Yujia, et al.
Pubblicazione: (2025)

Learning Modality Knowledge Alignment for Cross-Modality Transfer
di: Ma, Wenxuan, et al.
Pubblicazione: (2024)

RLBind: Adversarial-Invariant Cross-Modal Alignment for Unified Robust Embeddings
di: Lu, Yuhong
Pubblicazione: (2025)

Self-Enhanced Image Clustering with Cross-Modal Semantic Consistency
di: Li, Zihan, et al.
Pubblicazione: (2025)

Geometry-Aware Cross Modal Alignment for Light Field-LiDAR Semantic Segmentation
di: Luo, Jie, et al.
Pubblicazione: (2025)

Unifying Visual and Semantic Feature Spaces with Diffusion Models for Enhanced Cross-Modal Alignment
di: Zheng, Yuze, et al.
Pubblicazione: (2024)

CrossOver: 3D Scene Cross-Modal Alignment
di: Sarkar, Sayan Deb, et al.
Pubblicazione: (2025)

Enhancing Audio-Visual Spiking Neural Networks through Semantic-Alignment and Cross-Modal Residual Learning
di: He, Xiang, et al.
Pubblicazione: (2025)

Robust Multimodal Semantic Segmentation with Balanced Modality Contributions
di: Tan, Jiaqi, et al.
Pubblicazione: (2025)

Causal Disentanglement and Cross-Modal Alignment for Enhanced Few-Shot Learning
di: Jiang, Tianjiao, et al.
Pubblicazione: (2025)

AlignGen: Boosting Personalized Image Generation with Cross-Modality Prior Alignment
di: Lin, Yiheng, et al.
Pubblicazione: (2025)

CrossWeaver: Cross-modal Weaving for Arbitrary-Modality Semantic Segmentation
di: Zhang, Zelin, et al.
Pubblicazione: (2026)

Asymmetric Cross-Modal Knowledge Distillation: Bridging Modalities with Weak Semantic Consistency
di: Wei, Riling, et al.
Pubblicazione: (2025)

Cross-Modal and Uni-Modal Soft-Label Alignment for Image-Text Retrieval
di: Huang, Hailang, et al.
Pubblicazione: (2024)

Semantic-Preserving Cross-Style Visual Reasoning for Robust Multi-Modal Understanding in Large Vision-Language Models
di: Nakayama, Aya, et al.
Pubblicazione: (2025)

MANTA: Cross-Modal Semantic Alignment and Information-Theoretic Optimization for Long-form Multimodal Understanding
di: Zhong, Ziqi, et al.
Pubblicazione: (2025)

MolFM-Lite: Multi-Modal Molecular Property Prediction with Conformer Ensemble Attention and Cross-Modal Fusion
di: Shah, Syed Omer, et al.
Pubblicazione: (2026)

Deciphering Cross-Modal Alignment in Large Vision-Language Models with Modality Integration Rate
di: Huang, Qidong, et al.
Pubblicazione: (2024)

Memory-based Cross-modal Semantic Alignment Network for Radiology Report Generation
di: Tao, Yitian, et al.
Pubblicazione: (2024)

DiMPLe -- Disentangled Multi-Modal Prompt Learning: Enhancing Out-Of-Distribution Alignment with Invariant and Spurious Feature Separation
di: Rahman, Umaima, et al.
Pubblicazione: (2025)

CMTA: Cross-Modal Temporal Alignment for Event-guided Video Deblurring
di: Kim, Taewoo, et al.
Pubblicazione: (2024)

Guiding Cross-Modal Representations with MLLM Priors via Preference Alignment
di: Zhao, Pengfei, et al.
Pubblicazione: (2025)

MMLGNet: Cross-Modal Alignment of Remote Sensing Data using CLIP
di: Chaudhary, Aditya, et al.
Pubblicazione: (2026)

TUNI: Real-time RGB-T Semantic Segmentation with Unified Multi-Modal Feature Extraction and Cross-Modal Feature Fusion
di: Guo, Xiaodong, et al.
Pubblicazione: (2025)

Cross Modal Fine-Grained Alignment via Granularity-Aware and Region-Uncertain Modeling
di: Liu, Jiale, et al.
Pubblicazione: (2025)

CHARM: Collaborative Harmonization across Arbitrary Modalities for Modality-agnostic Semantic Segmentation
di: Wen, Lekang, et al.
Pubblicazione: (2025)

Robust Cross-Domain Adaptation in Texture Features Transferring for Wood Chip Moisture Content Prediction
di: Rahman, Abdur, et al.
Pubblicazione: (2025)

BiXFormer: A Robust Framework for Maximizing Modality Effectiveness in Multi-Modal Semantic Segmentation
di: Chen, Jialei, et al.
Pubblicazione: (2025)

Ultrasound Report Generation with Cross-Modality Feature Alignment via Unsupervised Guidance
di: Li, Jun, et al.
Pubblicazione: (2024)

DecAlign: Hierarchical Cross-Modal Alignment for Decoupled Multimodal Representation Learning
di: Qian, Chengxuan, et al.
Pubblicazione: (2025)

Cross-Modal Prototype Alignment and Mixing for Training-Free Few-Shot Classification
di: Goswami, Dipam, et al.
Pubblicazione: (2026)

Hierarchical Cross-Modal Alignment for Open-Vocabulary 3D Object Detection
di: Zhao, Youjun, et al.
Pubblicazione: (2025)

StructAlign: Structured Cross-Modal Alignment for Continual Text-to-Video Retrieval
di: Wang, Shaokun, et al.
Pubblicazione: (2026)

Cross-Modal-Domain Generalization Through Semantically Aligned Discrete Representations
di: Sen, Souptik, et al.
Pubblicazione: (2026)

Cross-Modal Synergies: Unveiling the Potential of Motion-Aware Fusion Networks in Handling Dynamic and Static ReID Scenarios
di: Ling, Fuxi, et al.
Pubblicazione: (2025)

Federated Cross-Modal Retrieval with Missing Modalities via Semantic Routing and Adapter Personalization
di: Zhou, Hefeng, et al.
Pubblicazione: (2026)