:: Library Catalog

Buchumschlag

Gespeichert in:

Bibliographische Detailangaben
Hauptverfasser:	Song, Yucheng, Ge, Yifan, Li, Junhao, Liao, Zhining, Liao, Zhifang
Format:	Preprint
Veröffentlicht:	2025
Schlagworte:	Computer Vision and Pattern Recognition
Online-Zugang:	https://arxiv.org/abs/2511.02271
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Ähnliche Einträge

FGML-DG: Feynman-Inspired Cognitive Science Paradigm for Cross-Domain Medical Image Segmentation
von: Song, Yucheng, et al.
Veröffentlicht: (2026)

TreeFedDG: Alleviating Global Drift in Federated Domain Generalization for Medical Image Segmentation
von: Song, Yucheng, et al.
Veröffentlicht: (2025)

Cross-Modal Causal Intervention for Medical Report Generation
von: Chen, Weixing, et al.
Veröffentlicht: (2023)

Exploring Boundary-Aware Spatial-Frequency Fusion for Camouflaged Object Detection
von: Yu, Song, et al.
Veröffentlicht: (2026)

ClinKD: Cross-Modal Clinical Knowledge Distiller For Multi-Task Medical Images
von: Ge, Hongyu, et al.
Veröffentlicht: (2025)

AnimeGamer: Infinite Anime Life Simulation with Next Game State Prediction
von: Cheng, Junhao, et al.
Veröffentlicht: (2025)

Source-Free Cross-Modal Knowledge Transfer by Unleashing the Potential of Task-Irrelevant Data
von: Zhu, Jinjing, et al.
Veröffentlicht: (2024)

Video-Holmes: Can MLLM Think Like Holmes for Complex Video Reasoning?
von: Cheng, Junhao, et al.
Veröffentlicht: (2025)

Semantic Causality-Aware Vision-Based 3D Occupancy Prediction
von: Chen, Dubing, et al.
Veröffentlicht: (2025)

Video-as-Answer: Predict and Generate Next Video Event with Joint-GRPO
von: Cheng, Junhao, et al.
Veröffentlicht: (2025)

Interpreting and Enhancing Emotional Circuits in Large Vision-Language Models via Cross-Modal Information Flow
von: Zhang, Chengsheng, et al.
Veröffentlicht: (2026)

Cross Modality Image Translation In Medical Imaging Using Generative Frameworks
von: Romoli, Giulia, et al.
Veröffentlicht: (2026)

Robust Egocentric Referring Video Object Segmentation via Dual-Modal Causal Intervention
von: Liu, Haijing, et al.
Veröffentlicht: (2025)

Multi-View Industrial Anomaly Detection with Epipolar Constrained Cross-View Fusion
von: Liu, Yifan, et al.
Veröffentlicht: (2025)

VIHD: Visual Intervention-based Hallucination Detection for Medical Visual Question Answering
von: Chen, Jiayi, et al.
Veröffentlicht: (2026)

RHVI-FDD: A Hierarchical Decoupling Framework for Low-Light Image Enhancement
von: Yang, Junhao, et al.
Veröffentlicht: (2026)

Prototype-Enhanced Confidence Modeling for Cross-Modal Medical Image-Report Retrieval
von: Gowda, Shreyank N, et al.
Veröffentlicht: (2025)

Improving Joint Audio-Video Generation with Cross-Modal Context Learning
von: Ma, Bingqi, et al.
Veröffentlicht: (2026)

RIHA: Report-Image Hierarchical Alignment for Radiology Report Generation
von: Chen, Yucheng, et al.
Veröffentlicht: (2026)

Cross-Modal Clinical Knowledge Integration for Mammography Report Generation
von: Zhu, Jiayi, et al.
Veröffentlicht: (2026)

MetaSSL: A General Heterogeneous Loss for Semi-Supervised Medical Image Segmentation
von: Zhao, Weiren, et al.
Veröffentlicht: (2025)

CausalCLIPSeg: Unlocking CLIP's Potential in Referring Medical Image Segmentation with Causal Intervention
von: Chen, Yaxiong, et al.
Veröffentlicht: (2025)

Cross-Modal Clustering-Guided Negative Sampling for Self-Supervised Joint Learning from Medical Images and Reports
von: Lan, Libin, et al.
Veröffentlicht: (2025)

Character Mixing for Video Generation
von: Liao, Tingting, et al.
Veröffentlicht: (2025)

Ultrasound Report Generation with Cross-Modality Feature Alignment via Unsupervised Guidance
von: Li, Jun, et al.
Veröffentlicht: (2024)

Rad-VLSM: A Cross-Modal Framework with Semantics-Assisted Prompting for Medical Segmentation and Diagnosis
von: Zhang, Fengyi, et al.
Veröffentlicht: (2026)

MedRAT: Unpaired Medical Report Generation via Auxiliary Tasks
von: Hirsch, Elad, et al.
Veröffentlicht: (2024)

ToLL: Topological Layout Learning with Asymmetric Cross-View Structural Distillation for 3D Scene Graph Generation Pretraining
von: Huang, Yucheng, et al.
Veröffentlicht: (2026)

Federated Learning for Cross-Modality Medical Image Segmentation via Augmentation-Driven Generalization
von: Nagaraju, Sachin Dudda, et al.
Veröffentlicht: (2026)

Learning to Search: A Decision-Based Agent for Knowledge-Based Visual Question Answering
von: Chen, Zhuohong, et al.
Veröffentlicht: (2026)

Cross-Modal Conditioned Reconstruction for Language-guided Medical Image Segmentation
von: Huang, Xiaoshuang, et al.
Veröffentlicht: (2024)

Image Translation-Based Unsupervised Cross-Modality Domain Adaptation for Medical Image Segmentation
von: Yang, Tao, et al.
Veröffentlicht: (2025)

OracleSage: Towards Unified Visual-Linguistic Understanding of Oracle Bone Scripts through Cross-Modal Knowledge Fusion
von: Jiang, Hanqi, et al.
Veröffentlicht: (2024)

Cross-modal Causal Intervention for Alzheimer's Disease Prediction
von: Jin, Yutao, et al.
Veröffentlicht: (2025)

DecAlign: Hierarchical Cross-Modal Alignment for Decoupled Multimodal Representation Learning
von: Qian, Chengxuan, et al.
Veröffentlicht: (2025)

A Multimodal Fusion Framework for Bridge Defect Detection with Cross-Verification
von: Rachuri, Ravi Datta, et al.
Veröffentlicht: (2024)

Multimodal Unsupervised Domain Generalization by Retrieving Across the Modality Gap
von: Liao, Christopher, et al.
Veröffentlicht: (2024)

CHARM: Collaborative Harmonization across Arbitrary Modalities for Modality-agnostic Semantic Segmentation
von: Wen, Lekang, et al.
Veröffentlicht: (2025)

DMAF-Net: An Effective Modality Rebalancing Framework for Incomplete Multi-Modal Medical Image Segmentation
von: Lan, Libin, et al.
Veröffentlicht: (2025)

ForgeDreamer: Industrial Text-to-3D Generation with Multi-Expert LoRA and Cross-View Hypergraph
von: Cai, Junhao, et al.
Veröffentlicht: (2026)