:: Library Catalog

Image de couverture de livre

Enregistré dans:

Détails bibliographiques
Auteurs principaux:	Cao, Thanh Hieu, Tran, Trung Khang, Pham, Gia Thinh, Diep, Tuong Nghiem, Nguyen, Thanh Binh
Format:	Preprint
Publié:	2025
Sujets:	Computer Vision and Pattern Recognition Artificial Intelligence
Accès en ligne:	https://arxiv.org/abs/2511.00419
Tags:	Ajouter un tag Pas de tags, Soyez le premier à ajouter un tag!

Documents similaires

MELCOT: A Hybrid Learning Architecture with Marginal Preservation for Matrix-Valued Regression
par: Tran, Khang, et autres
Publié: (2025)

Efficient and Concise Explanations for Object Detection with Gaussian-Class Activation Mapping Explainer
par: Nguyen, Quoc Khanh, et autres
Publié: (2024)

Enhancing the Fairness and Performance of Edge Cameras with Explainable AI
par: Nguyen, Truong Thanh Hung, et autres
Publié: (2024)

Learning Disentangled Stain and Structural Representations for Semi-Supervised Histopathology Segmentation
par: Pham, Ha-Hieu, et autres
Publié: (2025)

BTS-rPPG: Orthogonal Butterfly Temporal Shifting for Remote Photoplethysmography
par: Nguyen, Ba-Thinh, et autres
Publié: (2026)

HOT: Harmonic-Constrained Optimal Transport for Remote Photoplethysmography Domain Adaptation
par: Nguyen, Ba-Thinh, et autres
Publié: (2026)

ReCap: Event-Aware Image Captioning with Article Retrieval and Semantic Gaussian Normalization
par: Nguyen, Thinh-Phuc, et autres
Publié: (2025)

LangXAI: Integrating Large Vision Models for Generating Textual Explanations to Enhance Explainability in Visual Perception Tasks
par: Nguyen, Truong Thanh Hung, et autres
Publié: (2024)

Weather-Robust Cross-View Geo-Localization via Prototype-Based Semantic Part Discovery
par: Tran, Chi-Nguyen, et autres
Publié: (2026)

AutoViVQA: A Large-Scale Automatically Constructed Dataset for Vietnamese Visual Question Answering
par: Tuong, Nguyen Anh, et autres
Publié: (2026)

ViCLIP-OT: The First Foundation Vision-Language Model for Vietnamese Image-Text Retrieval with Optimal Transport
par: Tran, Quoc-Khang, et autres
Publié: (2026)

VisionGuard: Synergistic Framework for Helmet Violation Detection
par: Nguyen, Lam-Huy, et autres
Publié: (2025)

Semi-Supervised Semantic Segmentation using Redesigned Self-Training for White Blood Cells
par: Luu, Vinh Quoc, et autres
Publié: (2024)

Predictive Spectral Calibration for Source-Free Test-Time Regression
par: Kiet, Nguyen Viet Tuan, et autres
Publié: (2026)

IGL-DT: Iterative Global-Local Feature Learning with Dual-Teacher Semantic Segmentation Framework under Limited Annotation Scheme
par: Tran, Dinh Dai Quan, et autres
Publié: (2025)

SEMT: Static-Expansion-Mesh Transformer Network Architecture for Remote Sensing Image Captioning
par: Truong, Khang, et autres
Publié: (2025)

Revolutionizing Precise Low Back Pain Diagnosis via Contrastive Learning
par: Le, Thanh Binh, et autres
Publié: (2025)

SwiftBrush v2: Make Your One-step Diffusion Model Better Than Its Teacher
par: Dao, Trung, et autres
Publié: (2024)

Leveraging Model Soups to Classify Intangible Cultural Heritage Images from the Mekong Delta
par: Tran, Quoc-Khang, et autres
Publié: (2026)

Multimedia Verification Through Multi-Agent Deep Research Multimodal Large Language Models
par: Le, Huy Hoan, et autres
Publié: (2025)

AC-MAMBASEG: An adaptive convolution and Mamba-based architecture for enhanced skin lesion segmentation
par: Nguyen, Viet-Thanh, et autres
Publié: (2024)

XAI-Enhanced Semantic Segmentation Models for Visual Quality Inspection
par: Clement, Tobias, et autres
Publié: (2024)

CT to PET Translation: A Large-scale Dataset and Domain-Knowledge-Guided Diffusion Approach
par: Nguyen, Dac Thai, et autres
Publié: (2024)

MasHeNe: A Benchmark for Head and Neck CT Mass Segmentation using Window-Enhanced Mamba with Frequency-Domain Integration
par: Dao, Thao Thi Phuong, et autres
Publié: (2025)

CovHuSeg: An Enhanced Approach for Kidney Pathology Segmentation
par: Trinh, Huy, et autres
Publié: (2024)

Learning to Stop Overthinking at Test Time
par: Bao, Hieu Tran, et autres
Publié: (2025)

Handling Supervision Scarcity in Chest X-ray Classification: Long-Tailed and Zero-Shot Learning
par: Pham, Ha-Hieu, et autres
Publié: (2026)

QCFace: Image Quality Control for boosting Face Representation & Recognition
par: Doan-Ngo, Duc-Phuong, et autres
Publié: (2025)

DiFlowDubber: Discrete Flow Matching for Automated Video Dubbing via Cross-Modal Alignment and Synchronization
par: Nguyen, Ngoc-Son, et autres
Publié: (2026)

Brain Tumor Segmentation in MRI Images with 3D U-Net and Contextual Transformer
par: Nguyen, Thien-Qua T., et autres
Publié: (2024)

RESOUND: Speech Reconstruction from Silent Videos via Acoustic-Semantic Decomposed Modeling
par: Pham, Long-Khanh, et autres
Publié: (2025)

Examining Monitoring System: Detecting Abnormal Behavior In Online Examinations
par: Ngo, Dinh An, et autres
Publié: (2024)

From Specialist to Generalist: Unlocking SAM's Learning Potential on Unlabeled Medical Images
par: Vu, Vi, et autres
Publié: (2026)

Guiding Noisy Label Conditional Diffusion Models with Score-based Discriminator Correction
par: Cong, Dat Nguyen, et autres
Publié: (2025)

LightX3ECG: A Lightweight and eXplainable Deep Learning System for 3-lead Electrocardiogram Classification
par: Le, Khiem H., et autres
Publié: (2022)

Toward a Vision-Language Foundation Model for Medical Data: Multimodal Dataset and Benchmarks for Vietnamese PET/CT Report Generation
par: Nguyen, Huu Tien, et autres
Publié: (2025)

STER-VLM: Spatio-Temporal With Enhanced Reference Vision-Language Models
par: Nguyen-Nhu, Tinh-Anh, et autres
Publié: (2025)

Self-supervised Video Object Segmentation with Distillation Learning of Deformable Attention
par: Truong, Quang-Trung, et autres
Publié: (2024)

Enhancing Long-Term Person Re-Identification Using Global, Local Body Part, and Head Streams
par: Thanh, Duy Tran, et autres
Publié: (2024)

Multimodal Contextualized Support for Enhancing Video Retrieval System
par: Nguyen-Le, Quoc-Bao, et autres
Publié: (2024)