:: Library Catalog

Image de couverture de livre

Enregistré dans:

Détails bibliographiques
Auteurs principaux:	Luo, Yu, Huang, Nan, Yu, Sophie, Xu, Hendry, Wang, Jerry, Wang, Colin, Liu, Zhichao, Zeng, Chen
Format:	Preprint
Publié:	2025
Sujets:	Computer Vision and Pattern Recognition
Accès en ligne:	https://arxiv.org/abs/2510.22225
Tags:	Ajouter un tag Pas de tags, Soyez le premier à ajouter un tag!

Documents similaires

Towards Stable Cross-Domain Depression Recognition under Missing Modalities
par: Chen, Jiuyi, et autres
Publié: (2025)

Semantic Audio-Visual Navigation in Continuous Environments
par: Zeng, Yichen, et autres
Publié: (2026)

ELPG-DTFS: Prior-Guided Adaptive Time-Frequency Graph Neural Network for EEG Depression Diagnosis
par: Qiu, Jingru, et autres
Publié: (2025)

Frequency-Domain Decomposition and Recomposition for Robust Audio-Visual Segmentation
par: Shen, Yunzhe, et autres
Publié: (2025)

Continual Learning in the Frequency Domain
par: Liu, Ruiqi, et autres
Publié: (2024)

Evaluating Adversarial Robustness in the Spatial Frequency Domain
par: Liao, Keng-Hsin, et autres
Publié: (2024)

WaveRNet: Wavelet-Guided Frequency Learning for Multi-Source Domain-Generalized Retinal Vessel Segmentation
par: Wang, Chanchan, et autres
Publié: (2026)

Incomplete Modality Disentangled Representation for Ophthalmic Disease Grading and Diagnosis
par: Liu, Chengzhi, et autres
Publié: (2025)

SFD-Mamba2Net: Structure-Guided Frequency-Enhanced Dual-Stream Mamba2 Network for Coronary Artery Segmentation
par: Mu, Nan, et autres
Publié: (2025)

FrequencyCT: Frequency Domain Self-supervised Low-dose CT Denoising
par: Wei, Guoquan, et autres
Publié: (2026)

LVOmniBench: Pioneering Long Audio-Video Understanding Evaluation for Omnimodal LLMs
par: Tao, Keda, et autres
Publié: (2026)

Improving Out-of-Domain Robustness with Targeted Augmentation in Frequency and Pixel Spaces
par: Wang, Ruoqi, et autres
Publié: (2025)

Robust Audio-Visual Segmentation via Audio-Guided Visual Convergent Alignment
par: Liu, Chen, et autres
Publié: (2025)

Hierarchical Graph Feature Enhancement with Adaptive Frequency Modulation for Visual Recognition
par: Zhao, Feiyue, et autres
Publié: (2025)

IDRL: An Individual-Aware Multimodal Depression-Related Representation Learning Framework for Depression Diagnosis
par: Wang, Chongxiao, et autres
Publié: (2026)

Mutual Forcing: Dual-Mode Self-Evolution for Fast Autoregressive Audio-Video Character Generation
par: Zhou, Yupeng, et autres
Publié: (2026)

PSTNet: Enhanced Polyp Segmentation with Multi-scale Alignment and Frequency Domain Integration
par: Xu, Wenhao, et autres
Publié: (2024)

READ-Net: Clarifying Emotional Ambiguity via Adaptive Feature Recalibration for Audio-Visual Depression Detection
par: Chen, Chenglizhao, et autres
Publié: (2026)

SVDC: Consistent Direct Time-of-Flight Video Depth Completion with Frequency Selective Fusion
par: Zhu, Xuan, et autres
Publié: (2025)

Diffusion-based Adversarial Purification from the Perspective of the Frequency Domain
par: Pei, Gaozheng, et autres
Publié: (2025)

Earth-Adapter: Bridge the Geospatial Domain Gaps with Mixture of Frequency Adaptation
par: Hu, Xiaoxing, et autres
Publié: (2025)

Beyond Flat Text: Dual Self-inherited Guidance for Visual Text Generation
par: Luo, Minxing, et autres
Publié: (2025)

FreqGRL: Suppressing Low-Frequency Bias and Mining High-Frequency Knowledge for Cross-Domain Few-Shot Learning
par: Hui, Siqi, et autres
Publié: (2025)

When Eyes and Ears Disagree: Can MLLMs Discern Audio-Visual Confusion?
par: Ye, Qilang, et autres
Publié: (2025)

A Spatial-Frequency Aware Multi-Scale Fusion Network for Real-Time Deepfake Detection
par: Lv, Libo, et autres
Publié: (2025)

FSDENet: A Frequency and Spatial Domains based Detail Enhancement Network for Remote Sensing Semantic Segmentation
par: Fu, Jiahao, et autres
Publié: (2025)

Anomaly Detection in Electrocardiograms: Advancing Clinical Diagnosis Through Self-Supervised Learning
par: Jiang, Aofan, et autres
Publié: (2024)

Self-supervised Anomaly Detection Pretraining Enhances Long-tail ECG Diagnosis
par: Jiang, Aofan, et autres
Publié: (2024)

AVESFormer: Efficient Transformer Design for Real-Time Audio-Visual Segmentation
par: Wang, Zili, et autres
Publié: (2024)

Breaking Watermarks in the Frequency Domain: A Modulated Diffusion Attack Framework
par: Wang, Chunpeng, et autres
Publié: (2026)

Dual-stream Feature Augmentation for Domain Generalization
par: Wang, Shanshan, et autres
Publié: (2024)

Active Perception Agent for Omnimodal Audio-Video Understanding
par: Tao, Keda, et autres
Publié: (2025)

Dual Structure-Aware Image Filterings for Semi-supervised Medical Image Segmentation
par: Gu, Yuliang, et autres
Publié: (2023)

DW-DGAT: Dynamically Weighted Dual Graph Attention Network for Neurodegenerative Disease Diagnosis
par: Liang, Chengjia, et autres
Publié: (2026)

Semantic Data Augmentation Enhanced Invariant Risk Minimization for Medical Image Domain Generalization
par: Zhu, Yaoyao, et autres
Publié: (2025)

DualFast: Dual-Speedup Framework for Fast Sampling of Diffusion Models
par: Yu, Hu, et autres
Publié: (2025)

Frequency Autoregressive Image Generation with Continuous Tokens
par: Yu, Hu, et autres
Publié: (2025)

VABench: A Comprehensive Benchmark for Audio-Video Generation
par: Hua, Daili, et autres
Publié: (2025)

DualCP: Rehearsal-Free Domain-Incremental Learning via Dual-Level Concept Prototype
par: Wang, Qiang, et autres
Publié: (2025)

KAN-Based Fusion of Dual-Domain for Audio-Driven Facial Landmarks Generation
par: Vo-Thanh, Hoang-Son, et autres
Publié: (2024)