Salvato in:
| Autori principali: | Guo, Yuchen, Gong, Junli, Cai, Hongmin, Cheung, Yiu-ming, Su, Weifeng |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2024
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2409.10328 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
Can Segmentation Models Understand the World? Towards Proactive Affordance Reasoning via Visual Chain-of-Thought
di: Guo, Yuchen, et al.
Pubblicazione: (2026)
di: Guo, Yuchen, et al.
Pubblicazione: (2026)
LumiVideo: An Intelligent Agentic System for Video Color Grading
di: Guo, Yuchen, et al.
Pubblicazione: (2026)
di: Guo, Yuchen, et al.
Pubblicazione: (2026)
PEAM: Parametric Embodied Agent Memory through Contrastive Internalization of Experience in Minecraft
di: Guo, Yuchen, et al.
Pubblicazione: (2026)
di: Guo, Yuchen, et al.
Pubblicazione: (2026)
DAE-Fuse: An Adaptive Discriminative Autoencoder for Multi-Modality Image Fusion
di: Guo, Yuchen, et al.
Pubblicazione: (2024)
di: Guo, Yuchen, et al.
Pubblicazione: (2024)
Bringing Multimodal Large Language Models to Infrared-Visible Image Fusion Quality Assessment
di: Guo, Yuchen, et al.
Pubblicazione: (2026)
di: Guo, Yuchen, et al.
Pubblicazione: (2026)
Adding Thermal Awareness to Visual Systems in Real-Time via Distilled Diffusion Models
di: Guo, Yuchen, et al.
Pubblicazione: (2026)
di: Guo, Yuchen, et al.
Pubblicazione: (2026)
TYrPPG: Uncomplicated and Enhanced Learning Capability rPPG for Remote Heart Rate Estimation
di: Chen, Taixi, et al.
Pubblicazione: (2025)
di: Chen, Taixi, et al.
Pubblicazione: (2025)
Long-Tailed Visual Recognition via Permutation-Invariant Head-to-Tail Feature Fusion
di: Li, Mengke, et al.
Pubblicazione: (2025)
di: Li, Mengke, et al.
Pubblicazione: (2025)
Semantic-guided Fine-tuning of Foundation Model for Long-tailed Visual Recognition
di: Peng, Yufei, et al.
Pubblicazione: (2025)
di: Peng, Yufei, et al.
Pubblicazione: (2025)
Ask, Attend, Attack: A Effective Decision-Based Black-Box Targeted Attack for Image-to-Text Models
di: Zeng, Qingyuan, et al.
Pubblicazione: (2024)
di: Zeng, Qingyuan, et al.
Pubblicazione: (2024)
BiSegMamba: Efficient Bidirectional Tri-Oriented Mamba for 3D Medical Image Segmentation
di: Zada, Bakht, et al.
Pubblicazione: (2026)
di: Zada, Bakht, et al.
Pubblicazione: (2026)
Feature Fusion from Head to Tail for Long-Tailed Visual Recognition
di: Li, Mengke, et al.
Pubblicazione: (2023)
di: Li, Mengke, et al.
Pubblicazione: (2023)
BiPVL-Seg: Bidirectional Progressive Vision-Language Fusion with Global-Local Alignment for Medical Image Segmentation
di: Sultan, Rafi Ibn, et al.
Pubblicazione: (2025)
di: Sultan, Rafi Ibn, et al.
Pubblicazione: (2025)
LuSeg: Efficient Negative and Positive Obstacles Segmentation via Contrast-Driven Multi-Modal Feature Fusion on the Lunar
di: Jiao, Shuaifeng, et al.
Pubblicazione: (2025)
di: Jiao, Shuaifeng, et al.
Pubblicazione: (2025)
MOKD: Cross-domain Finetuning for Few-shot Classification via Maximizing Optimized Kernel Dependence
di: Tian, Hongduan, et al.
Pubblicazione: (2024)
di: Tian, Hongduan, et al.
Pubblicazione: (2024)
DrFuse: Learning Disentangled Representation for Clinical Multi-Modal Fusion with Missing Modality and Modal Inconsistency
di: Yao, Wenfang, et al.
Pubblicazione: (2024)
di: Yao, Wenfang, et al.
Pubblicazione: (2024)
UniFuse: A Unified All-in-One Framework for Multi-Modal Medical Image Fusion Under Diverse Degradations and Misalignments
di: Su, Dayong, et al.
Pubblicazione: (2025)
di: Su, Dayong, et al.
Pubblicazione: (2025)
CalFuse: Multi-Modal Continual Learning via Feature Calibration and Parameter Fusion
di: Guo, Juncen, et al.
Pubblicazione: (2025)
di: Guo, Juncen, et al.
Pubblicazione: (2025)
Adapt PointFormer: 3D Point Cloud Analysis via Adapting 2D Visual Transformers
di: Li, Mengke, et al.
Pubblicazione: (2024)
di: Li, Mengke, et al.
Pubblicazione: (2024)
ConvTransSeg: A Multi-resolution Convolution-Transformer Network for Medical Image Segmentation
di: Gong, Zhendi, et al.
Pubblicazione: (2022)
di: Gong, Zhendi, et al.
Pubblicazione: (2022)
Epistemic Uncertainty for Generated Image Detection
di: Nie, Jun, et al.
Pubblicazione: (2024)
di: Nie, Jun, et al.
Pubblicazione: (2024)
MulModSeg: Enhancing Unpaired Multi-Modal Medical Image Segmentation with Modality-Conditioned Text Embedding and Alternating Training
di: Li, Chengyin, et al.
Pubblicazione: (2024)
di: Li, Chengyin, et al.
Pubblicazione: (2024)
Synth4Seg -- Learning Defect Data Synthesis for Defect Segmentation using Bi-level Optimization
di: Mou, Shancong, et al.
Pubblicazione: (2024)
di: Mou, Shancong, et al.
Pubblicazione: (2024)
SegStitch: Multidimensional Transformer for Robust and Efficient Medical Imaging Segmentation
di: Tan, Shengbo, et al.
Pubblicazione: (2024)
di: Tan, Shengbo, et al.
Pubblicazione: (2024)
GBRIP: Granular Ball Representation for Imbalanced Partial Label Learning
di: Huang, Jintao, et al.
Pubblicazione: (2024)
di: Huang, Jintao, et al.
Pubblicazione: (2024)
Adaptive Point-Prompt Tuning: Fine-Tuning Heterogeneous Foundation Models for 3D Point Cloud Analysis
di: Li, Mengke, et al.
Pubblicazione: (2025)
di: Li, Mengke, et al.
Pubblicazione: (2025)
GaussianMarker: Uncertainty-Aware Copyright Protection of 3D Gaussian Splatting
di: Huang, Xiufeng, et al.
Pubblicazione: (2024)
di: Huang, Xiufeng, et al.
Pubblicazione: (2024)
SegMoTE: Token-Level Mixture of Experts for Medical Image Segmentation
di: Lu, Yujie, et al.
Pubblicazione: (2026)
di: Lu, Yujie, et al.
Pubblicazione: (2026)
AWM-Fuse: Multi-Modality Image Fusion for Adverse Weather via Global and Local Text Perception
di: Li, Xilai, et al.
Pubblicazione: (2025)
di: Li, Xilai, et al.
Pubblicazione: (2025)
DeferredSeg: A Multi-Expert Deferral Framework for Trustworthy Medical Image Segmentation
di: Tian, Qiuyu, et al.
Pubblicazione: (2026)
di: Tian, Qiuyu, et al.
Pubblicazione: (2026)
MedSeg-R: Medical Image Segmentation with Clinical Reasoning
di: Shao, Hao, et al.
Pubblicazione: (2025)
di: Shao, Hao, et al.
Pubblicazione: (2025)
SegVol: Universal and Interactive Volumetric Medical Image Segmentation
di: Du, Yuxin, et al.
Pubblicazione: (2023)
di: Du, Yuxin, et al.
Pubblicazione: (2023)
SegBook: A Simple Baseline and Cookbook for Volumetric Medical Image Segmentation
di: Ye, Jin, et al.
Pubblicazione: (2024)
di: Ye, Jin, et al.
Pubblicazione: (2024)
SegKAN: High-Resolution Medical Image Segmentation with Long-Distance Dependencies
di: Tan, Shengbo, et al.
Pubblicazione: (2024)
di: Tan, Shengbo, et al.
Pubblicazione: (2024)
Improving Visual Prompt Tuning by Gaussian Neighborhood Minimization for Long-Tailed Visual Recognition
di: Li, Mengke, et al.
Pubblicazione: (2024)
di: Li, Mengke, et al.
Pubblicazione: (2024)
RefineSeg: Dual Coarse-to-Fine Learning for Medical Image Segmentation
di: Du, Anghong, et al.
Pubblicazione: (2025)
di: Du, Anghong, et al.
Pubblicazione: (2025)
FuseFL: One-Shot Federated Learning through the Lens of Causality with Progressive Model Fusion
di: Tang, Zhenheng, et al.
Pubblicazione: (2024)
di: Tang, Zhenheng, et al.
Pubblicazione: (2024)
Is Foreground Prototype Sufficient? Few-Shot Medical Image Segmentation with Background-Fused Prototype
di: Tang, Song, et al.
Pubblicazione: (2024)
di: Tang, Song, et al.
Pubblicazione: (2024)
Adjusting Logit in Gaussian Form for Long-Tailed Visual Recognition
di: Li, Mengke, et al.
Pubblicazione: (2023)
di: Li, Mengke, et al.
Pubblicazione: (2023)
BiSeg-SAM: Weakly-Supervised Post-Processing Framework for Boosting Binary Segmentation in Segment Anything Models
di: Su, Encheng, et al.
Pubblicazione: (2025)
di: Su, Encheng, et al.
Pubblicazione: (2025)
Documenti analoghi
-
Can Segmentation Models Understand the World? Towards Proactive Affordance Reasoning via Visual Chain-of-Thought
di: Guo, Yuchen, et al.
Pubblicazione: (2026) -
LumiVideo: An Intelligent Agentic System for Video Color Grading
di: Guo, Yuchen, et al.
Pubblicazione: (2026) -
PEAM: Parametric Embodied Agent Memory through Contrastive Internalization of Experience in Minecraft
di: Guo, Yuchen, et al.
Pubblicazione: (2026) -
DAE-Fuse: An Adaptive Discriminative Autoencoder for Multi-Modality Image Fusion
di: Guo, Yuchen, et al.
Pubblicazione: (2024) -
Bringing Multimodal Large Language Models to Infrared-Visible Image Fusion Quality Assessment
di: Guo, Yuchen, et al.
Pubblicazione: (2026)