Salvato in:
| Autori principali: | Jing, Liu, Rahman, Amirul |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2024
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2412.09870 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
Elevating Visual Question Answering through Implicitly Learned Reasoning Pathways in LVLMs
di: Jing, Liu, et al.
Pubblicazione: (2025)
di: Jing, Liu, et al.
Pubblicazione: (2025)
Cross-Modal Scene Semantic Alignment for Image Complexity Assessment
di: Luo, Yuqing, et al.
Pubblicazione: (2025)
di: Luo, Yuqing, et al.
Pubblicazione: (2025)
MPCAR: Multi-Perspective Contextual Augmentation for Enhanced Visual Reasoning in Large Vision-Language Models
di: Rahman, Amirul, et al.
Pubblicazione: (2025)
di: Rahman, Amirul, et al.
Pubblicazione: (2025)
Enhancing CLIP Robustness via Cross-Modality Alignment
di: Zhu, Xingyu, et al.
Pubblicazione: (2025)
di: Zhu, Xingyu, et al.
Pubblicazione: (2025)
Semantic-Enhanced Cross-Modal Place Recognition for Robust Robot Localization
di: Lin, Yujia, et al.
Pubblicazione: (2025)
di: Lin, Yujia, et al.
Pubblicazione: (2025)
Learning Modality Knowledge Alignment for Cross-Modality Transfer
di: Ma, Wenxuan, et al.
Pubblicazione: (2024)
di: Ma, Wenxuan, et al.
Pubblicazione: (2024)
RLBind: Adversarial-Invariant Cross-Modal Alignment for Unified Robust Embeddings
di: Lu, Yuhong
Pubblicazione: (2025)
di: Lu, Yuhong
Pubblicazione: (2025)
Self-Enhanced Image Clustering with Cross-Modal Semantic Consistency
di: Li, Zihan, et al.
Pubblicazione: (2025)
di: Li, Zihan, et al.
Pubblicazione: (2025)
Geometry-Aware Cross Modal Alignment for Light Field-LiDAR Semantic Segmentation
di: Luo, Jie, et al.
Pubblicazione: (2025)
di: Luo, Jie, et al.
Pubblicazione: (2025)
Unifying Visual and Semantic Feature Spaces with Diffusion Models for Enhanced Cross-Modal Alignment
di: Zheng, Yuze, et al.
Pubblicazione: (2024)
di: Zheng, Yuze, et al.
Pubblicazione: (2024)
CrossOver: 3D Scene Cross-Modal Alignment
di: Sarkar, Sayan Deb, et al.
Pubblicazione: (2025)
di: Sarkar, Sayan Deb, et al.
Pubblicazione: (2025)
Enhancing Audio-Visual Spiking Neural Networks through Semantic-Alignment and Cross-Modal Residual Learning
di: He, Xiang, et al.
Pubblicazione: (2025)
di: He, Xiang, et al.
Pubblicazione: (2025)
Robust Multimodal Semantic Segmentation with Balanced Modality Contributions
di: Tan, Jiaqi, et al.
Pubblicazione: (2025)
di: Tan, Jiaqi, et al.
Pubblicazione: (2025)
Causal Disentanglement and Cross-Modal Alignment for Enhanced Few-Shot Learning
di: Jiang, Tianjiao, et al.
Pubblicazione: (2025)
di: Jiang, Tianjiao, et al.
Pubblicazione: (2025)
AlignGen: Boosting Personalized Image Generation with Cross-Modality Prior Alignment
di: Lin, Yiheng, et al.
Pubblicazione: (2025)
di: Lin, Yiheng, et al.
Pubblicazione: (2025)
CrossWeaver: Cross-modal Weaving for Arbitrary-Modality Semantic Segmentation
di: Zhang, Zelin, et al.
Pubblicazione: (2026)
di: Zhang, Zelin, et al.
Pubblicazione: (2026)
Asymmetric Cross-Modal Knowledge Distillation: Bridging Modalities with Weak Semantic Consistency
di: Wei, Riling, et al.
Pubblicazione: (2025)
di: Wei, Riling, et al.
Pubblicazione: (2025)
Cross-Modal and Uni-Modal Soft-Label Alignment for Image-Text Retrieval
di: Huang, Hailang, et al.
Pubblicazione: (2024)
di: Huang, Hailang, et al.
Pubblicazione: (2024)
Semantic-Preserving Cross-Style Visual Reasoning for Robust Multi-Modal Understanding in Large Vision-Language Models
di: Nakayama, Aya, et al.
Pubblicazione: (2025)
di: Nakayama, Aya, et al.
Pubblicazione: (2025)
MANTA: Cross-Modal Semantic Alignment and Information-Theoretic Optimization for Long-form Multimodal Understanding
di: Zhong, Ziqi, et al.
Pubblicazione: (2025)
di: Zhong, Ziqi, et al.
Pubblicazione: (2025)
MolFM-Lite: Multi-Modal Molecular Property Prediction with Conformer Ensemble Attention and Cross-Modal Fusion
di: Shah, Syed Omer, et al.
Pubblicazione: (2026)
di: Shah, Syed Omer, et al.
Pubblicazione: (2026)
Deciphering Cross-Modal Alignment in Large Vision-Language Models with Modality Integration Rate
di: Huang, Qidong, et al.
Pubblicazione: (2024)
di: Huang, Qidong, et al.
Pubblicazione: (2024)
Memory-based Cross-modal Semantic Alignment Network for Radiology Report Generation
di: Tao, Yitian, et al.
Pubblicazione: (2024)
di: Tao, Yitian, et al.
Pubblicazione: (2024)
DiMPLe -- Disentangled Multi-Modal Prompt Learning: Enhancing Out-Of-Distribution Alignment with Invariant and Spurious Feature Separation
di: Rahman, Umaima, et al.
Pubblicazione: (2025)
di: Rahman, Umaima, et al.
Pubblicazione: (2025)
CMTA: Cross-Modal Temporal Alignment for Event-guided Video Deblurring
di: Kim, Taewoo, et al.
Pubblicazione: (2024)
di: Kim, Taewoo, et al.
Pubblicazione: (2024)
Guiding Cross-Modal Representations with MLLM Priors via Preference Alignment
di: Zhao, Pengfei, et al.
Pubblicazione: (2025)
di: Zhao, Pengfei, et al.
Pubblicazione: (2025)
MMLGNet: Cross-Modal Alignment of Remote Sensing Data using CLIP
di: Chaudhary, Aditya, et al.
Pubblicazione: (2026)
di: Chaudhary, Aditya, et al.
Pubblicazione: (2026)
TUNI: Real-time RGB-T Semantic Segmentation with Unified Multi-Modal Feature Extraction and Cross-Modal Feature Fusion
di: Guo, Xiaodong, et al.
Pubblicazione: (2025)
di: Guo, Xiaodong, et al.
Pubblicazione: (2025)
Cross Modal Fine-Grained Alignment via Granularity-Aware and Region-Uncertain Modeling
di: Liu, Jiale, et al.
Pubblicazione: (2025)
di: Liu, Jiale, et al.
Pubblicazione: (2025)
CHARM: Collaborative Harmonization across Arbitrary Modalities for Modality-agnostic Semantic Segmentation
di: Wen, Lekang, et al.
Pubblicazione: (2025)
di: Wen, Lekang, et al.
Pubblicazione: (2025)
Robust Cross-Domain Adaptation in Texture Features Transferring for Wood Chip Moisture Content Prediction
di: Rahman, Abdur, et al.
Pubblicazione: (2025)
di: Rahman, Abdur, et al.
Pubblicazione: (2025)
BiXFormer: A Robust Framework for Maximizing Modality Effectiveness in Multi-Modal Semantic Segmentation
di: Chen, Jialei, et al.
Pubblicazione: (2025)
di: Chen, Jialei, et al.
Pubblicazione: (2025)
Ultrasound Report Generation with Cross-Modality Feature Alignment via Unsupervised Guidance
di: Li, Jun, et al.
Pubblicazione: (2024)
di: Li, Jun, et al.
Pubblicazione: (2024)
DecAlign: Hierarchical Cross-Modal Alignment for Decoupled Multimodal Representation Learning
di: Qian, Chengxuan, et al.
Pubblicazione: (2025)
di: Qian, Chengxuan, et al.
Pubblicazione: (2025)
Cross-Modal Prototype Alignment and Mixing for Training-Free Few-Shot Classification
di: Goswami, Dipam, et al.
Pubblicazione: (2026)
di: Goswami, Dipam, et al.
Pubblicazione: (2026)
Hierarchical Cross-Modal Alignment for Open-Vocabulary 3D Object Detection
di: Zhao, Youjun, et al.
Pubblicazione: (2025)
di: Zhao, Youjun, et al.
Pubblicazione: (2025)
StructAlign: Structured Cross-Modal Alignment for Continual Text-to-Video Retrieval
di: Wang, Shaokun, et al.
Pubblicazione: (2026)
di: Wang, Shaokun, et al.
Pubblicazione: (2026)
Cross-Modal-Domain Generalization Through Semantically Aligned Discrete Representations
di: Sen, Souptik, et al.
Pubblicazione: (2026)
di: Sen, Souptik, et al.
Pubblicazione: (2026)
Cross-Modal Synergies: Unveiling the Potential of Motion-Aware Fusion Networks in Handling Dynamic and Static ReID Scenarios
di: Ling, Fuxi, et al.
Pubblicazione: (2025)
di: Ling, Fuxi, et al.
Pubblicazione: (2025)
Federated Cross-Modal Retrieval with Missing Modalities via Semantic Routing and Adapter Personalization
di: Zhou, Hefeng, et al.
Pubblicazione: (2026)
di: Zhou, Hefeng, et al.
Pubblicazione: (2026)
Documenti analoghi
-
Elevating Visual Question Answering through Implicitly Learned Reasoning Pathways in LVLMs
di: Jing, Liu, et al.
Pubblicazione: (2025) -
Cross-Modal Scene Semantic Alignment for Image Complexity Assessment
di: Luo, Yuqing, et al.
Pubblicazione: (2025) -
MPCAR: Multi-Perspective Contextual Augmentation for Enhanced Visual Reasoning in Large Vision-Language Models
di: Rahman, Amirul, et al.
Pubblicazione: (2025) -
Enhancing CLIP Robustness via Cross-Modality Alignment
di: Zhu, Xingyu, et al.
Pubblicazione: (2025) -
Semantic-Enhanced Cross-Modal Place Recognition for Robust Robot Localization
di: Lin, Yujia, et al.
Pubblicazione: (2025)