Enregistré dans:
| Auteurs principaux: | Tran, Kim Hoang, Do, Phuc Vuong, Ly, Ngoc Quoc, Le, Ngan |
|---|---|
| Format: | Preprint |
| Publié: |
2024
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2404.09951 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
Boosting Medical Vision-Language Pretraining via Momentum Self-Distillation under Limited Computing Resources
par: Pham, Phuc, et autres
Publié: (2025)
par: Pham, Phuc, et autres
Publié: (2025)
HENASY: Learning to Assemble Scene-Entities for Egocentric Video-Language Model
par: Vo, Khoa, et autres
Publié: (2024)
par: Vo, Khoa, et autres
Publié: (2024)
TP-GMOT: Tracking Generic Multiple Object by Textual Prompt with Motion-Appearance Cost (MAC) SORT
par: Anh, Duy Le Dinh, et autres
Publié: (2024)
par: Anh, Duy Le Dinh, et autres
Publié: (2024)
Ensemble Learning for Vietnamese Scene Text Spotting in Urban Environments
par: Nguyen, Hieu, et autres
Publié: (2024)
par: Nguyen, Hieu, et autres
Publié: (2024)
UI-Styler: Ultrasound Image Style Transfer with Class-Aware Prompts for Cross-Device Diagnosis Using a Frozen Black-Box Inference Network
par: Do-Tran, Nhat-Tuong, et autres
Publié: (2025)
par: Do-Tran, Nhat-Tuong, et autres
Publié: (2025)
Point-Unet: A Context-aware Point-based Neural Network for Volumetric Segmentation
par: Ho, Ngoc-Vuong, et autres
Publié: (2022)
par: Ho, Ngoc-Vuong, et autres
Publié: (2022)
A Comprehensive Study on Medical Image Segmentation using Deep Neural Networks
par: Dao, Loan, et autres
Publié: (2025)
par: Dao, Loan, et autres
Publié: (2025)
Recent Advances in Medical Image Classification
par: Dao, Loan, et autres
Publié: (2025)
par: Dao, Loan, et autres
Publié: (2025)
Ontology-based knowledge representation for bone disease diagnosis: a foundation for safe and sustainable medical artificial intelligence systems
par: Dao, Loan, et autres
Publié: (2025)
par: Dao, Loan, et autres
Publié: (2025)
LatentFM: A Latent Flow Matching Approach for Generative Medical Image Segmentation
par: Ngoc, Huynh Trinh, et autres
Publié: (2025)
par: Ngoc, Huynh Trinh, et autres
Publié: (2025)
EDGER: EDge-Guided with HEatmap Refinement for Generalizable Image Forgery Localization
par: Le-Phan, Minh-Khoa, et autres
Publié: (2026)
par: Le-Phan, Minh-Khoa, et autres
Publié: (2026)
Few-Shot Precise Event Spotting via Unified Multi-Entity Graph and Distillation
par: Liu, Zhaoyu, et autres
Publié: (2025)
par: Liu, Zhaoyu, et autres
Publié: (2025)
OSL-ActionSpotting: A Unified Library for Action Spotting in Sports Videos
par: Benzakour, Yassine, et autres
Publié: (2024)
par: Benzakour, Yassine, et autres
Publié: (2024)
U-CESE: Unified Clip-based Event Search Engine for AI Challenge HCMC 2025
par: Le, Duc-Nhuan, et autres
Publié: (2026)
par: Le, Duc-Nhuan, et autres
Publié: (2026)
DEAR: Depth-Enhanced Action Recognition
par: Rahmaniboldaji, Sadegh, et autres
Publié: (2024)
par: Rahmaniboldaji, Sadegh, et autres
Publié: (2024)
HAtt-Flow: Hierarchical Attention-Flow Mechanism for Group Activity Scene Graph Generation in Videos
par: Chappa, Naga VS Raviteja, et autres
Publié: (2023)
par: Chappa, Naga VS Raviteja, et autres
Publié: (2023)
Progressive Multi-granular Alignments for Grounded Reasoning in Large Vision-Language Models
par: Le, Quang-Hung, et autres
Publié: (2024)
par: Le, Quang-Hung, et autres
Publié: (2024)
Event-Enriched Image Analysis Grand Challenge at ACM Multimedia 2025
par: Tran, Thien-Phuc, et autres
Publié: (2025)
par: Tran, Thien-Phuc, et autres
Publié: (2025)
SADL: An Effective In-Context Learning Method for Compositional Visual QA
par: Dang, Long Hoang, et autres
Publié: (2024)
par: Dang, Long Hoang, et autres
Publié: (2024)
UNO: Unifying One-stage Video Scene Graph Generation via Object-Centric Visual Representation Learning
par: Le, Huy, et autres
Publié: (2025)
par: Le, Huy, et autres
Publié: (2025)
Automated Image Recognition Framework
par: Nguyen, Quang-Binh, et autres
Publié: (2025)
par: Nguyen, Quang-Binh, et autres
Publié: (2025)
Enhanced Kalman with Adaptive Appearance Motion SORT for Grounded Generic Multiple Object Tracking
par: Anh, Duy Le Dinh, et autres
Publié: (2024)
par: Anh, Duy Le Dinh, et autres
Publié: (2024)
TRUST: Token-dRiven Ultrasound Style Transfer for Cross-Device Adaptation
par: Do-Tran, Nhat-Tuong, et autres
Publié: (2025)
par: Do-Tran, Nhat-Tuong, et autres
Publié: (2025)
DNA: Dual-branch Network with Adaptation for Open-Set Online Handwriting Generation
par: Huang, Tsai-Ling, et autres
Publié: (2025)
par: Huang, Tsai-Ling, et autres
Publié: (2025)
Finding the Trigger: Causal Abductive Reasoning on Video Events
par: Le, Thao Minh, et autres
Publié: (2025)
par: Le, Thao Minh, et autres
Publié: (2025)
LoG-VMamba: Local-Global Vision Mamba for Medical Image Segmentation
par: Dang, Trung Dinh Quoc, et autres
Publié: (2024)
par: Dang, Trung Dinh Quoc, et autres
Publié: (2024)
Robust Deepfake Detection: Mitigating Spatial Attention Drift via Calibrated Complementary Ensembles
par: Le-Phan, Minh-Khoa, et autres
Publié: (2026)
par: Le-Phan, Minh-Khoa, et autres
Publié: (2026)
Distortion-Aware Adversarial Attacks on Bounding Boxes of Object Detectors
par: Phuc, Pham, et autres
Publié: (2024)
par: Phuc, Pham, et autres
Publié: (2024)
Z-GMOT: Zero-shot Generic Multiple Object Tracking
par: Tran, Kim Hoang, et autres
Publié: (2023)
par: Tran, Kim Hoang, et autres
Publié: (2023)
Language-Driven 6-DoF Grasp Detection Using Negative Prompt Guidance
par: Nguyen, Toan, et autres
Publié: (2024)
par: Nguyen, Toan, et autres
Publié: (2024)
CarcassFormer: An End-to-end Transformer-based Framework for Simultaneous Localization, Segmentation and Classification of Poultry Carcass Defect
par: Tran, Minh, et autres
Publié: (2024)
par: Tran, Minh, et autres
Publié: (2024)
Amodal Instance Segmentation with Diffusion Shape Prior Estimation
par: Tran, Minh, et autres
Publié: (2024)
par: Tran, Minh, et autres
Publié: (2024)
Reference-Based Post-OCR Processing with LLM for Precise Diacritic Text in Historical Document Recognition
par: Do, Thao, et autres
Publié: (2024)
par: Do, Thao, et autres
Publié: (2024)
Lightweight Language-driven Grasp Detection using Conditional Consistency Model
par: Nguyen, Nghia, et autres
Publié: (2024)
par: Nguyen, Nghia, et autres
Publié: (2024)
Interactive Interface For Semantic Segmentation Dataset Synthesis
par: Tran, Ngoc-Do, et autres
Publié: (2025)
par: Tran, Ngoc-Do, et autres
Publié: (2025)
Preserving Clusters in Prompt Learning for Unsupervised Domain Adaptation
par: Vuong, Tung-Long, et autres
Publié: (2025)
par: Vuong, Tung-Long, et autres
Publié: (2025)
A Novel Tuning Method for Real-time Multiple-Object Tracking Utilizing Thermal Sensor with Complexity Motion Pattern
par: Tran, Duong Nguyen-Ngoc, et autres
Publié: (2025)
par: Tran, Duong Nguyen-Ngoc, et autres
Publié: (2025)
Stratified Domain Adaptation: A Progressive Self-Training Approach for Scene Text Recognition
par: Le, Kha Nhat, et autres
Publié: (2024)
par: Le, Kha Nhat, et autres
Publié: (2024)
PGDS: Pose-Guidance Deep Supervision for Mitigating Clothes-Changing in Person Re-Identification
par: Trinh, Quoc-Huy, et autres
Publié: (2023)
par: Trinh, Quoc-Huy, et autres
Publié: (2023)
MedSAD-CLIP: Supervised CLIP with Token-Patch Cross-Attention for Medical Anomaly Detection and Segmentation
par: Tran, Thuy Truong, et autres
Publié: (2026)
par: Tran, Thuy Truong, et autres
Publié: (2026)
Documents similaires
-
Boosting Medical Vision-Language Pretraining via Momentum Self-Distillation under Limited Computing Resources
par: Pham, Phuc, et autres
Publié: (2025) -
HENASY: Learning to Assemble Scene-Entities for Egocentric Video-Language Model
par: Vo, Khoa, et autres
Publié: (2024) -
TP-GMOT: Tracking Generic Multiple Object by Textual Prompt with Motion-Appearance Cost (MAC) SORT
par: Anh, Duy Le Dinh, et autres
Publié: (2024) -
Ensemble Learning for Vietnamese Scene Text Spotting in Urban Environments
par: Nguyen, Hieu, et autres
Publié: (2024) -
UI-Styler: Ultrasound Image Style Transfer with Class-Aware Prompts for Cross-Device Diagnosis Using a Frozen Black-Box Inference Network
par: Do-Tran, Nhat-Tuong, et autres
Publié: (2025)