Gespeichert in:
| Hauptverfasser: | Song, Yucheng, Ge, Yifan, Li, Junhao, Liao, Zhining, Liao, Zhifang |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2025
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2511.02271 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
FGML-DG: Feynman-Inspired Cognitive Science Paradigm for Cross-Domain Medical Image Segmentation
von: Song, Yucheng, et al.
Veröffentlicht: (2026)
von: Song, Yucheng, et al.
Veröffentlicht: (2026)
TreeFedDG: Alleviating Global Drift in Federated Domain Generalization for Medical Image Segmentation
von: Song, Yucheng, et al.
Veröffentlicht: (2025)
von: Song, Yucheng, et al.
Veröffentlicht: (2025)
Cross-Modal Causal Intervention for Medical Report Generation
von: Chen, Weixing, et al.
Veröffentlicht: (2023)
von: Chen, Weixing, et al.
Veröffentlicht: (2023)
Exploring Boundary-Aware Spatial-Frequency Fusion for Camouflaged Object Detection
von: Yu, Song, et al.
Veröffentlicht: (2026)
von: Yu, Song, et al.
Veröffentlicht: (2026)
ClinKD: Cross-Modal Clinical Knowledge Distiller For Multi-Task Medical Images
von: Ge, Hongyu, et al.
Veröffentlicht: (2025)
von: Ge, Hongyu, et al.
Veröffentlicht: (2025)
AnimeGamer: Infinite Anime Life Simulation with Next Game State Prediction
von: Cheng, Junhao, et al.
Veröffentlicht: (2025)
von: Cheng, Junhao, et al.
Veröffentlicht: (2025)
Source-Free Cross-Modal Knowledge Transfer by Unleashing the Potential of Task-Irrelevant Data
von: Zhu, Jinjing, et al.
Veröffentlicht: (2024)
von: Zhu, Jinjing, et al.
Veröffentlicht: (2024)
Video-Holmes: Can MLLM Think Like Holmes for Complex Video Reasoning?
von: Cheng, Junhao, et al.
Veröffentlicht: (2025)
von: Cheng, Junhao, et al.
Veröffentlicht: (2025)
Semantic Causality-Aware Vision-Based 3D Occupancy Prediction
von: Chen, Dubing, et al.
Veröffentlicht: (2025)
von: Chen, Dubing, et al.
Veröffentlicht: (2025)
Video-as-Answer: Predict and Generate Next Video Event with Joint-GRPO
von: Cheng, Junhao, et al.
Veröffentlicht: (2025)
von: Cheng, Junhao, et al.
Veröffentlicht: (2025)
Interpreting and Enhancing Emotional Circuits in Large Vision-Language Models via Cross-Modal Information Flow
von: Zhang, Chengsheng, et al.
Veröffentlicht: (2026)
von: Zhang, Chengsheng, et al.
Veröffentlicht: (2026)
Cross Modality Image Translation In Medical Imaging Using Generative Frameworks
von: Romoli, Giulia, et al.
Veröffentlicht: (2026)
von: Romoli, Giulia, et al.
Veröffentlicht: (2026)
Robust Egocentric Referring Video Object Segmentation via Dual-Modal Causal Intervention
von: Liu, Haijing, et al.
Veröffentlicht: (2025)
von: Liu, Haijing, et al.
Veröffentlicht: (2025)
Multi-View Industrial Anomaly Detection with Epipolar Constrained Cross-View Fusion
von: Liu, Yifan, et al.
Veröffentlicht: (2025)
von: Liu, Yifan, et al.
Veröffentlicht: (2025)
VIHD: Visual Intervention-based Hallucination Detection for Medical Visual Question Answering
von: Chen, Jiayi, et al.
Veröffentlicht: (2026)
von: Chen, Jiayi, et al.
Veröffentlicht: (2026)
RHVI-FDD: A Hierarchical Decoupling Framework for Low-Light Image Enhancement
von: Yang, Junhao, et al.
Veröffentlicht: (2026)
von: Yang, Junhao, et al.
Veröffentlicht: (2026)
Prototype-Enhanced Confidence Modeling for Cross-Modal Medical Image-Report Retrieval
von: Gowda, Shreyank N, et al.
Veröffentlicht: (2025)
von: Gowda, Shreyank N, et al.
Veröffentlicht: (2025)
Improving Joint Audio-Video Generation with Cross-Modal Context Learning
von: Ma, Bingqi, et al.
Veröffentlicht: (2026)
von: Ma, Bingqi, et al.
Veröffentlicht: (2026)
RIHA: Report-Image Hierarchical Alignment for Radiology Report Generation
von: Chen, Yucheng, et al.
Veröffentlicht: (2026)
von: Chen, Yucheng, et al.
Veröffentlicht: (2026)
Cross-Modal Clinical Knowledge Integration for Mammography Report Generation
von: Zhu, Jiayi, et al.
Veröffentlicht: (2026)
von: Zhu, Jiayi, et al.
Veröffentlicht: (2026)
MetaSSL: A General Heterogeneous Loss for Semi-Supervised Medical Image Segmentation
von: Zhao, Weiren, et al.
Veröffentlicht: (2025)
von: Zhao, Weiren, et al.
Veröffentlicht: (2025)
CausalCLIPSeg: Unlocking CLIP's Potential in Referring Medical Image Segmentation with Causal Intervention
von: Chen, Yaxiong, et al.
Veröffentlicht: (2025)
von: Chen, Yaxiong, et al.
Veröffentlicht: (2025)
Cross-Modal Clustering-Guided Negative Sampling for Self-Supervised Joint Learning from Medical Images and Reports
von: Lan, Libin, et al.
Veröffentlicht: (2025)
von: Lan, Libin, et al.
Veröffentlicht: (2025)
Character Mixing for Video Generation
von: Liao, Tingting, et al.
Veröffentlicht: (2025)
von: Liao, Tingting, et al.
Veröffentlicht: (2025)
Ultrasound Report Generation with Cross-Modality Feature Alignment via Unsupervised Guidance
von: Li, Jun, et al.
Veröffentlicht: (2024)
von: Li, Jun, et al.
Veröffentlicht: (2024)
Rad-VLSM: A Cross-Modal Framework with Semantics-Assisted Prompting for Medical Segmentation and Diagnosis
von: Zhang, Fengyi, et al.
Veröffentlicht: (2026)
von: Zhang, Fengyi, et al.
Veröffentlicht: (2026)
MedRAT: Unpaired Medical Report Generation via Auxiliary Tasks
von: Hirsch, Elad, et al.
Veröffentlicht: (2024)
von: Hirsch, Elad, et al.
Veröffentlicht: (2024)
ToLL: Topological Layout Learning with Asymmetric Cross-View Structural Distillation for 3D Scene Graph Generation Pretraining
von: Huang, Yucheng, et al.
Veröffentlicht: (2026)
von: Huang, Yucheng, et al.
Veröffentlicht: (2026)
Federated Learning for Cross-Modality Medical Image Segmentation via Augmentation-Driven Generalization
von: Nagaraju, Sachin Dudda, et al.
Veröffentlicht: (2026)
von: Nagaraju, Sachin Dudda, et al.
Veröffentlicht: (2026)
Learning to Search: A Decision-Based Agent for Knowledge-Based Visual Question Answering
von: Chen, Zhuohong, et al.
Veröffentlicht: (2026)
von: Chen, Zhuohong, et al.
Veröffentlicht: (2026)
Cross-Modal Conditioned Reconstruction for Language-guided Medical Image Segmentation
von: Huang, Xiaoshuang, et al.
Veröffentlicht: (2024)
von: Huang, Xiaoshuang, et al.
Veröffentlicht: (2024)
Image Translation-Based Unsupervised Cross-Modality Domain Adaptation for Medical Image Segmentation
von: Yang, Tao, et al.
Veröffentlicht: (2025)
von: Yang, Tao, et al.
Veröffentlicht: (2025)
OracleSage: Towards Unified Visual-Linguistic Understanding of Oracle Bone Scripts through Cross-Modal Knowledge Fusion
von: Jiang, Hanqi, et al.
Veröffentlicht: (2024)
von: Jiang, Hanqi, et al.
Veröffentlicht: (2024)
Cross-modal Causal Intervention for Alzheimer's Disease Prediction
von: Jin, Yutao, et al.
Veröffentlicht: (2025)
von: Jin, Yutao, et al.
Veröffentlicht: (2025)
DecAlign: Hierarchical Cross-Modal Alignment for Decoupled Multimodal Representation Learning
von: Qian, Chengxuan, et al.
Veröffentlicht: (2025)
von: Qian, Chengxuan, et al.
Veröffentlicht: (2025)
A Multimodal Fusion Framework for Bridge Defect Detection with Cross-Verification
von: Rachuri, Ravi Datta, et al.
Veröffentlicht: (2024)
von: Rachuri, Ravi Datta, et al.
Veröffentlicht: (2024)
Multimodal Unsupervised Domain Generalization by Retrieving Across the Modality Gap
von: Liao, Christopher, et al.
Veröffentlicht: (2024)
von: Liao, Christopher, et al.
Veröffentlicht: (2024)
CHARM: Collaborative Harmonization across Arbitrary Modalities for Modality-agnostic Semantic Segmentation
von: Wen, Lekang, et al.
Veröffentlicht: (2025)
von: Wen, Lekang, et al.
Veröffentlicht: (2025)
DMAF-Net: An Effective Modality Rebalancing Framework for Incomplete Multi-Modal Medical Image Segmentation
von: Lan, Libin, et al.
Veröffentlicht: (2025)
von: Lan, Libin, et al.
Veröffentlicht: (2025)
ForgeDreamer: Industrial Text-to-3D Generation with Multi-Expert LoRA and Cross-View Hypergraph
von: Cai, Junhao, et al.
Veröffentlicht: (2026)
von: Cai, Junhao, et al.
Veröffentlicht: (2026)
Ähnliche Einträge
-
FGML-DG: Feynman-Inspired Cognitive Science Paradigm for Cross-Domain Medical Image Segmentation
von: Song, Yucheng, et al.
Veröffentlicht: (2026) -
TreeFedDG: Alleviating Global Drift in Federated Domain Generalization for Medical Image Segmentation
von: Song, Yucheng, et al.
Veröffentlicht: (2025) -
Cross-Modal Causal Intervention for Medical Report Generation
von: Chen, Weixing, et al.
Veröffentlicht: (2023) -
Exploring Boundary-Aware Spatial-Frequency Fusion for Camouflaged Object Detection
von: Yu, Song, et al.
Veröffentlicht: (2026) -
ClinKD: Cross-Modal Clinical Knowledge Distiller For Multi-Task Medical Images
von: Ge, Hongyu, et al.
Veröffentlicht: (2025)