:: Library Catalog

Image de couverture de livre

Enregistré dans:

Détails bibliographiques
Auteurs principaux:	Tran, Kim Hoang, Do, Phuc Vuong, Ly, Ngoc Quoc, Le, Ngan
Format:	Preprint
Publié:	2024
Sujets:	Computer Vision and Pattern Recognition
Accès en ligne:	https://arxiv.org/abs/2404.09951
Tags:	Ajouter un tag Pas de tags, Soyez le premier à ajouter un tag!

Documents similaires

Boosting Medical Vision-Language Pretraining via Momentum Self-Distillation under Limited Computing Resources
par: Pham, Phuc, et autres
Publié: (2025)

HENASY: Learning to Assemble Scene-Entities for Egocentric Video-Language Model
par: Vo, Khoa, et autres
Publié: (2024)

TP-GMOT: Tracking Generic Multiple Object by Textual Prompt with Motion-Appearance Cost (MAC) SORT
par: Anh, Duy Le Dinh, et autres
Publié: (2024)

Ensemble Learning for Vietnamese Scene Text Spotting in Urban Environments
par: Nguyen, Hieu, et autres
Publié: (2024)

UI-Styler: Ultrasound Image Style Transfer with Class-Aware Prompts for Cross-Device Diagnosis Using a Frozen Black-Box Inference Network
par: Do-Tran, Nhat-Tuong, et autres
Publié: (2025)

Point-Unet: A Context-aware Point-based Neural Network for Volumetric Segmentation
par: Ho, Ngoc-Vuong, et autres
Publié: (2022)

A Comprehensive Study on Medical Image Segmentation using Deep Neural Networks
par: Dao, Loan, et autres
Publié: (2025)

Recent Advances in Medical Image Classification
par: Dao, Loan, et autres
Publié: (2025)

Ontology-based knowledge representation for bone disease diagnosis: a foundation for safe and sustainable medical artificial intelligence systems
par: Dao, Loan, et autres
Publié: (2025)

LatentFM: A Latent Flow Matching Approach for Generative Medical Image Segmentation
par: Ngoc, Huynh Trinh, et autres
Publié: (2025)

EDGER: EDge-Guided with HEatmap Refinement for Generalizable Image Forgery Localization
par: Le-Phan, Minh-Khoa, et autres
Publié: (2026)

Few-Shot Precise Event Spotting via Unified Multi-Entity Graph and Distillation
par: Liu, Zhaoyu, et autres
Publié: (2025)

OSL-ActionSpotting: A Unified Library for Action Spotting in Sports Videos
par: Benzakour, Yassine, et autres
Publié: (2024)

U-CESE: Unified Clip-based Event Search Engine for AI Challenge HCMC 2025
par: Le, Duc-Nhuan, et autres
Publié: (2026)

DEAR: Depth-Enhanced Action Recognition
par: Rahmaniboldaji, Sadegh, et autres
Publié: (2024)

HAtt-Flow: Hierarchical Attention-Flow Mechanism for Group Activity Scene Graph Generation in Videos
par: Chappa, Naga VS Raviteja, et autres
Publié: (2023)

Progressive Multi-granular Alignments for Grounded Reasoning in Large Vision-Language Models
par: Le, Quang-Hung, et autres
Publié: (2024)

Event-Enriched Image Analysis Grand Challenge at ACM Multimedia 2025
par: Tran, Thien-Phuc, et autres
Publié: (2025)

SADL: An Effective In-Context Learning Method for Compositional Visual QA
par: Dang, Long Hoang, et autres
Publié: (2024)

UNO: Unifying One-stage Video Scene Graph Generation via Object-Centric Visual Representation Learning
par: Le, Huy, et autres
Publié: (2025)

Automated Image Recognition Framework
par: Nguyen, Quang-Binh, et autres
Publié: (2025)

Enhanced Kalman with Adaptive Appearance Motion SORT for Grounded Generic Multiple Object Tracking
par: Anh, Duy Le Dinh, et autres
Publié: (2024)

TRUST: Token-dRiven Ultrasound Style Transfer for Cross-Device Adaptation
par: Do-Tran, Nhat-Tuong, et autres
Publié: (2025)

DNA: Dual-branch Network with Adaptation for Open-Set Online Handwriting Generation
par: Huang, Tsai-Ling, et autres
Publié: (2025)

Finding the Trigger: Causal Abductive Reasoning on Video Events
par: Le, Thao Minh, et autres
Publié: (2025)

LoG-VMamba: Local-Global Vision Mamba for Medical Image Segmentation
par: Dang, Trung Dinh Quoc, et autres
Publié: (2024)

Robust Deepfake Detection: Mitigating Spatial Attention Drift via Calibrated Complementary Ensembles
par: Le-Phan, Minh-Khoa, et autres
Publié: (2026)

Distortion-Aware Adversarial Attacks on Bounding Boxes of Object Detectors
par: Phuc, Pham, et autres
Publié: (2024)

Z-GMOT: Zero-shot Generic Multiple Object Tracking
par: Tran, Kim Hoang, et autres
Publié: (2023)

Language-Driven 6-DoF Grasp Detection Using Negative Prompt Guidance
par: Nguyen, Toan, et autres
Publié: (2024)

CarcassFormer: An End-to-end Transformer-based Framework for Simultaneous Localization, Segmentation and Classification of Poultry Carcass Defect
par: Tran, Minh, et autres
Publié: (2024)

Amodal Instance Segmentation with Diffusion Shape Prior Estimation
par: Tran, Minh, et autres
Publié: (2024)

Reference-Based Post-OCR Processing with LLM for Precise Diacritic Text in Historical Document Recognition
par: Do, Thao, et autres
Publié: (2024)

Lightweight Language-driven Grasp Detection using Conditional Consistency Model
par: Nguyen, Nghia, et autres
Publié: (2024)

Interactive Interface For Semantic Segmentation Dataset Synthesis
par: Tran, Ngoc-Do, et autres
Publié: (2025)

Preserving Clusters in Prompt Learning for Unsupervised Domain Adaptation
par: Vuong, Tung-Long, et autres
Publié: (2025)

A Novel Tuning Method for Real-time Multiple-Object Tracking Utilizing Thermal Sensor with Complexity Motion Pattern
par: Tran, Duong Nguyen-Ngoc, et autres
Publié: (2025)

Stratified Domain Adaptation: A Progressive Self-Training Approach for Scene Text Recognition
par: Le, Kha Nhat, et autres
Publié: (2024)

PGDS: Pose-Guidance Deep Supervision for Mitigating Clothes-Changing in Person Re-Identification
par: Trinh, Quoc-Huy, et autres
Publié: (2023)

MedSAD-CLIP: Supervised CLIP with Token-Patch Cross-Attention for Medical Anomaly Detection and Segmentation
par: Tran, Thuy Truong, et autres
Publié: (2026)