Enregistré dans:
| Auteurs principaux: | Cao, Thanh Hieu, Tran, Trung Khang, Pham, Gia Thinh, Diep, Tuong Nghiem, Nguyen, Thanh Binh |
|---|---|
| Format: | Preprint |
| Publié: |
2025
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2511.00419 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
MELCOT: A Hybrid Learning Architecture with Marginal Preservation for Matrix-Valued Regression
par: Tran, Khang, et autres
Publié: (2025)
par: Tran, Khang, et autres
Publié: (2025)
Efficient and Concise Explanations for Object Detection with Gaussian-Class Activation Mapping Explainer
par: Nguyen, Quoc Khanh, et autres
Publié: (2024)
par: Nguyen, Quoc Khanh, et autres
Publié: (2024)
Enhancing the Fairness and Performance of Edge Cameras with Explainable AI
par: Nguyen, Truong Thanh Hung, et autres
Publié: (2024)
par: Nguyen, Truong Thanh Hung, et autres
Publié: (2024)
Learning Disentangled Stain and Structural Representations for Semi-Supervised Histopathology Segmentation
par: Pham, Ha-Hieu, et autres
Publié: (2025)
par: Pham, Ha-Hieu, et autres
Publié: (2025)
BTS-rPPG: Orthogonal Butterfly Temporal Shifting for Remote Photoplethysmography
par: Nguyen, Ba-Thinh, et autres
Publié: (2026)
par: Nguyen, Ba-Thinh, et autres
Publié: (2026)
HOT: Harmonic-Constrained Optimal Transport for Remote Photoplethysmography Domain Adaptation
par: Nguyen, Ba-Thinh, et autres
Publié: (2026)
par: Nguyen, Ba-Thinh, et autres
Publié: (2026)
ReCap: Event-Aware Image Captioning with Article Retrieval and Semantic Gaussian Normalization
par: Nguyen, Thinh-Phuc, et autres
Publié: (2025)
par: Nguyen, Thinh-Phuc, et autres
Publié: (2025)
LangXAI: Integrating Large Vision Models for Generating Textual Explanations to Enhance Explainability in Visual Perception Tasks
par: Nguyen, Truong Thanh Hung, et autres
Publié: (2024)
par: Nguyen, Truong Thanh Hung, et autres
Publié: (2024)
Weather-Robust Cross-View Geo-Localization via Prototype-Based Semantic Part Discovery
par: Tran, Chi-Nguyen, et autres
Publié: (2026)
par: Tran, Chi-Nguyen, et autres
Publié: (2026)
AutoViVQA: A Large-Scale Automatically Constructed Dataset for Vietnamese Visual Question Answering
par: Tuong, Nguyen Anh, et autres
Publié: (2026)
par: Tuong, Nguyen Anh, et autres
Publié: (2026)
ViCLIP-OT: The First Foundation Vision-Language Model for Vietnamese Image-Text Retrieval with Optimal Transport
par: Tran, Quoc-Khang, et autres
Publié: (2026)
par: Tran, Quoc-Khang, et autres
Publié: (2026)
VisionGuard: Synergistic Framework for Helmet Violation Detection
par: Nguyen, Lam-Huy, et autres
Publié: (2025)
par: Nguyen, Lam-Huy, et autres
Publié: (2025)
Semi-Supervised Semantic Segmentation using Redesigned Self-Training for White Blood Cells
par: Luu, Vinh Quoc, et autres
Publié: (2024)
par: Luu, Vinh Quoc, et autres
Publié: (2024)
Predictive Spectral Calibration for Source-Free Test-Time Regression
par: Kiet, Nguyen Viet Tuan, et autres
Publié: (2026)
par: Kiet, Nguyen Viet Tuan, et autres
Publié: (2026)
IGL-DT: Iterative Global-Local Feature Learning with Dual-Teacher Semantic Segmentation Framework under Limited Annotation Scheme
par: Tran, Dinh Dai Quan, et autres
Publié: (2025)
par: Tran, Dinh Dai Quan, et autres
Publié: (2025)
SEMT: Static-Expansion-Mesh Transformer Network Architecture for Remote Sensing Image Captioning
par: Truong, Khang, et autres
Publié: (2025)
par: Truong, Khang, et autres
Publié: (2025)
Revolutionizing Precise Low Back Pain Diagnosis via Contrastive Learning
par: Le, Thanh Binh, et autres
Publié: (2025)
par: Le, Thanh Binh, et autres
Publié: (2025)
SwiftBrush v2: Make Your One-step Diffusion Model Better Than Its Teacher
par: Dao, Trung, et autres
Publié: (2024)
par: Dao, Trung, et autres
Publié: (2024)
Leveraging Model Soups to Classify Intangible Cultural Heritage Images from the Mekong Delta
par: Tran, Quoc-Khang, et autres
Publié: (2026)
par: Tran, Quoc-Khang, et autres
Publié: (2026)
Multimedia Verification Through Multi-Agent Deep Research Multimodal Large Language Models
par: Le, Huy Hoan, et autres
Publié: (2025)
par: Le, Huy Hoan, et autres
Publié: (2025)
AC-MAMBASEG: An adaptive convolution and Mamba-based architecture for enhanced skin lesion segmentation
par: Nguyen, Viet-Thanh, et autres
Publié: (2024)
par: Nguyen, Viet-Thanh, et autres
Publié: (2024)
XAI-Enhanced Semantic Segmentation Models for Visual Quality Inspection
par: Clement, Tobias, et autres
Publié: (2024)
par: Clement, Tobias, et autres
Publié: (2024)
CT to PET Translation: A Large-scale Dataset and Domain-Knowledge-Guided Diffusion Approach
par: Nguyen, Dac Thai, et autres
Publié: (2024)
par: Nguyen, Dac Thai, et autres
Publié: (2024)
MasHeNe: A Benchmark for Head and Neck CT Mass Segmentation using Window-Enhanced Mamba with Frequency-Domain Integration
par: Dao, Thao Thi Phuong, et autres
Publié: (2025)
par: Dao, Thao Thi Phuong, et autres
Publié: (2025)
CovHuSeg: An Enhanced Approach for Kidney Pathology Segmentation
par: Trinh, Huy, et autres
Publié: (2024)
par: Trinh, Huy, et autres
Publié: (2024)
Learning to Stop Overthinking at Test Time
par: Bao, Hieu Tran, et autres
Publié: (2025)
par: Bao, Hieu Tran, et autres
Publié: (2025)
Handling Supervision Scarcity in Chest X-ray Classification: Long-Tailed and Zero-Shot Learning
par: Pham, Ha-Hieu, et autres
Publié: (2026)
par: Pham, Ha-Hieu, et autres
Publié: (2026)
QCFace: Image Quality Control for boosting Face Representation & Recognition
par: Doan-Ngo, Duc-Phuong, et autres
Publié: (2025)
par: Doan-Ngo, Duc-Phuong, et autres
Publié: (2025)
DiFlowDubber: Discrete Flow Matching for Automated Video Dubbing via Cross-Modal Alignment and Synchronization
par: Nguyen, Ngoc-Son, et autres
Publié: (2026)
par: Nguyen, Ngoc-Son, et autres
Publié: (2026)
Brain Tumor Segmentation in MRI Images with 3D U-Net and Contextual Transformer
par: Nguyen, Thien-Qua T., et autres
Publié: (2024)
par: Nguyen, Thien-Qua T., et autres
Publié: (2024)
RESOUND: Speech Reconstruction from Silent Videos via Acoustic-Semantic Decomposed Modeling
par: Pham, Long-Khanh, et autres
Publié: (2025)
par: Pham, Long-Khanh, et autres
Publié: (2025)
Examining Monitoring System: Detecting Abnormal Behavior In Online Examinations
par: Ngo, Dinh An, et autres
Publié: (2024)
par: Ngo, Dinh An, et autres
Publié: (2024)
From Specialist to Generalist: Unlocking SAM's Learning Potential on Unlabeled Medical Images
par: Vu, Vi, et autres
Publié: (2026)
par: Vu, Vi, et autres
Publié: (2026)
Guiding Noisy Label Conditional Diffusion Models with Score-based Discriminator Correction
par: Cong, Dat Nguyen, et autres
Publié: (2025)
par: Cong, Dat Nguyen, et autres
Publié: (2025)
LightX3ECG: A Lightweight and eXplainable Deep Learning System for 3-lead Electrocardiogram Classification
par: Le, Khiem H., et autres
Publié: (2022)
par: Le, Khiem H., et autres
Publié: (2022)
Toward a Vision-Language Foundation Model for Medical Data: Multimodal Dataset and Benchmarks for Vietnamese PET/CT Report Generation
par: Nguyen, Huu Tien, et autres
Publié: (2025)
par: Nguyen, Huu Tien, et autres
Publié: (2025)
STER-VLM: Spatio-Temporal With Enhanced Reference Vision-Language Models
par: Nguyen-Nhu, Tinh-Anh, et autres
Publié: (2025)
par: Nguyen-Nhu, Tinh-Anh, et autres
Publié: (2025)
Self-supervised Video Object Segmentation with Distillation Learning of Deformable Attention
par: Truong, Quang-Trung, et autres
Publié: (2024)
par: Truong, Quang-Trung, et autres
Publié: (2024)
Enhancing Long-Term Person Re-Identification Using Global, Local Body Part, and Head Streams
par: Thanh, Duy Tran, et autres
Publié: (2024)
par: Thanh, Duy Tran, et autres
Publié: (2024)
Multimodal Contextualized Support for Enhancing Video Retrieval System
par: Nguyen-Le, Quoc-Bao, et autres
Publié: (2024)
par: Nguyen-Le, Quoc-Bao, et autres
Publié: (2024)
Documents similaires
-
MELCOT: A Hybrid Learning Architecture with Marginal Preservation for Matrix-Valued Regression
par: Tran, Khang, et autres
Publié: (2025) -
Efficient and Concise Explanations for Object Detection with Gaussian-Class Activation Mapping Explainer
par: Nguyen, Quoc Khanh, et autres
Publié: (2024) -
Enhancing the Fairness and Performance of Edge Cameras with Explainable AI
par: Nguyen, Truong Thanh Hung, et autres
Publié: (2024) -
Learning Disentangled Stain and Structural Representations for Semi-Supervised Histopathology Segmentation
par: Pham, Ha-Hieu, et autres
Publié: (2025) -
BTS-rPPG: Orthogonal Butterfly Temporal Shifting for Remote Photoplethysmography
par: Nguyen, Ba-Thinh, et autres
Publié: (2026)