:: Library Catalog

Imagen de Portada

Guardado en:

Detalles Bibliográficos
Autores principales:	Nützel, Felix, Dombrowski, Mischa, Kainz, Bernhard
Formato:	Preprint
Publicado:	2025
Materias:	Computer Vision and Pattern Recognition
Acceso en línea:	https://arxiv.org/abs/2507.12236
Etiquetas:	Agregar Etiqueta Sin Etiquetas, Sea el primero en etiquetar este registro!

Ejemplares similares

The Learnability Gap in Medical Latent Diffusion
por: Dombrowski, Mischa, et al.
Publicado: (2026)

Flow Matching with Optimized Subclass Priors for Medical Image Augmentation
por: Nützel, Felix, et al.
Publicado: (2026)

LCMem: A Universal Model for Robust Image Memorization Detection
por: Dombrowski, Mischa, et al.
Publicado: (2025)

GRASP: Guided Residual Adapters with Sample-wise Partitioning
por: Nützel, Felix, et al.
Publicado: (2025)

Enabling PSO-Secure Synthetic Data Sharing Using Diversity-Aware Diffusion Models
por: Dombrowski, Mischa, et al.
Publicado: (2025)

Uncovering Hidden Subspaces in Video Diffusion Models Using Re-Identification
por: Dombrowski, Mischa, et al.
Publicado: (2024)

Image Generation Diversity Issues and How to Tame Them
por: Dombrowski, Mischa, et al.
Publicado: (2024)

JVID: Joint Video-Image Diffusion for Visual-Quality and Temporal-Consistency in Video Generation
por: Reynaud, Hadrien, et al.
Publicado: (2024)

EchoNet-Synthetic: Privacy-preserving Video Generation for Safe Medical Data Sharing
por: Reynaud, Hadrien, et al.
Publicado: (2024)

Feature-Conditioned Cascaded Video Diffusion Models for Precise Echocardiogram Synthesis
por: Reynaud, Hadrien, et al.
Publicado: (2023)

Ontology-Based Concept Distillation for Radiology Report Retrieval and Labeling
por: Nützel, Felix, et al.
Publicado: (2025)

Video Dataset Condensation with Diffusion Models
por: Li, Zhe, et al.
Publicado: (2025)

Graph Conditioned Diffusion for Controllable Histopathology Image Generation
por: Cechnicka, Sarah, et al.
Publicado: (2025)

Generalised Medical Phrase Grounding
por: Zhang, Wenjun, et al.
Publicado: (2025)

Uncertainty-aware Medical Diagnostic Phrase Identification and Grounding
por: Zou, Ke, et al.
Publicado: (2024)

A Joint Study of Phrase Grounding and Task Performance in Vision and Language Models
por: Kojima, Noriyuki, et al.
Publicado: (2023)

Exploring Phrase-Level Grounding with Text-to-Image Diffusion Model
por: Yang, Danni, et al.
Publicado: (2024)

Zero-Shot Medical Phrase Grounding with Off-the-shelf Diffusion Models
por: Vilouras, Konstantinos, et al.
Publicado: (2024)

Visual Alignment of Medical Vision-Language Models for Grounded Radiology Report Generation
por: Bose, Sarosij, et al.
Publicado: (2025)

Phrase Grounding-based Style Transfer for Single-Domain Generalized Object Detection
por: Li, Hao, et al.
Publicado: (2024)

ShapePuri: Shape Guided and Appearance Generalized Adversarial Purification
por: Li, Zhe, et al.
Publicado: (2026)

Empower Words: DualGround for Structured Phrase and Sentence-Level Temporal Grounding
por: Kang, Minseok, et al.
Publicado: (2025)

Resource-efficient Medical Image Analysis with Self-adapting Forward-Forward Networks
por: Müller, Johanna P., et al.
Publicado: (2024)

MedMO: Grounding and Understanding Multimodal Large Language Model for Medical Images
por: Deria, Ankan, et al.
Publicado: (2026)

Enriching Phrases with Coupled Pixel and Object Contexts for Panoptic Narrative Grounding
por: Hui, Tianrui, et al.
Publicado: (2023)

Grounding-IQA: Grounding Multimodal Language Model for Image Quality Assessment
por: Chen, Zheng, et al.
Publicado: (2024)

Label-free Motion-Conditioned Diffusion Model for Cardiac Ultrasound Synthesis
por: Li, Zhe, et al.
Publicado: (2025)

Learning Visual Grounding from Generative Vision and Language Model
por: Wang, Shijie, et al.
Publicado: (2024)

Bias Assessment and Data Drift Detection in Medical Image Analysis: A Survey
por: Dombrowski, Mischa, et al.
Publicado: (2024)

To Agree or To Be Right? The Grounding-Sycophancy Tradeoff in Medical Vision-Language Models
por: Aranya, OFM Riaz Rahman, et al.
Publicado: (2026)

Better Tokens for Better 3D: Advancing Vision-Language Modeling in 3D Medical Imaging
por: Hamamci, Ibrahim Ethem, et al.
Publicado: (2025)

Noise Crystallization and Liquid Noise: Zero-shot Video Generation using Image Diffusion Models
por: Khan, Muhammad Haaris, et al.
Publicado: (2024)

MAGIC: Multimodal Alignment & Grounding-aware Instruction Coreset for Vision-Language Models
por: Biswas, Shristi Das, et al.
Publicado: (2026)

Image Distillation for Safe Data Sharing in Histopathology
por: Li, Zhe, et al.
Publicado: (2024)

MedGround: Bridging the Evidence Gap in Medical Vision-Language Models with Verified Grounding Data
por: Zhang, Mengmeng, et al.
Publicado: (2026)

RoboLLM: Robotic Vision Tasks Grounded on Multimodal Large Language Models
por: Long, Zijun, et al.
Publicado: (2023)

Phrase Decoupling Cross-Modal Hierarchical Matching and Progressive Position Correction for Visual Grounding
por: Xie, Minghong, et al.
Publicado: (2024)

Parameter-Efficient Fine-Tuning Medical Multimodal Large Language Models for Medical Visual Grounding
por: He, Jinlong, et al.
Publicado: (2024)

3DReasonKnee: Advancing Grounded Reasoning in Medical Vision Language Models
por: Sambara, Sraavya, et al.
Publicado: (2025)

Wasserstein-Aligned Localisation for VLM-Based Distributional OOD Detection in Medical Imaging
por: Kainz, Bernhard, et al.
Publicado: (2026)