Enregistré dans:
| Auteurs principaux: | Luo, Yu, Huang, Nan, Yu, Sophie, Xu, Hendry, Wang, Jerry, Wang, Colin, Liu, Zhichao, Zeng, Chen |
|---|---|
| Format: | Preprint |
| Publié: |
2025
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2510.22225 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
Towards Stable Cross-Domain Depression Recognition under Missing Modalities
par: Chen, Jiuyi, et autres
Publié: (2025)
par: Chen, Jiuyi, et autres
Publié: (2025)
Semantic Audio-Visual Navigation in Continuous Environments
par: Zeng, Yichen, et autres
Publié: (2026)
par: Zeng, Yichen, et autres
Publié: (2026)
ELPG-DTFS: Prior-Guided Adaptive Time-Frequency Graph Neural Network for EEG Depression Diagnosis
par: Qiu, Jingru, et autres
Publié: (2025)
par: Qiu, Jingru, et autres
Publié: (2025)
Frequency-Domain Decomposition and Recomposition for Robust Audio-Visual Segmentation
par: Shen, Yunzhe, et autres
Publié: (2025)
par: Shen, Yunzhe, et autres
Publié: (2025)
Continual Learning in the Frequency Domain
par: Liu, Ruiqi, et autres
Publié: (2024)
par: Liu, Ruiqi, et autres
Publié: (2024)
Evaluating Adversarial Robustness in the Spatial Frequency Domain
par: Liao, Keng-Hsin, et autres
Publié: (2024)
par: Liao, Keng-Hsin, et autres
Publié: (2024)
WaveRNet: Wavelet-Guided Frequency Learning for Multi-Source Domain-Generalized Retinal Vessel Segmentation
par: Wang, Chanchan, et autres
Publié: (2026)
par: Wang, Chanchan, et autres
Publié: (2026)
Incomplete Modality Disentangled Representation for Ophthalmic Disease Grading and Diagnosis
par: Liu, Chengzhi, et autres
Publié: (2025)
par: Liu, Chengzhi, et autres
Publié: (2025)
SFD-Mamba2Net: Structure-Guided Frequency-Enhanced Dual-Stream Mamba2 Network for Coronary Artery Segmentation
par: Mu, Nan, et autres
Publié: (2025)
par: Mu, Nan, et autres
Publié: (2025)
FrequencyCT: Frequency Domain Self-supervised Low-dose CT Denoising
par: Wei, Guoquan, et autres
Publié: (2026)
par: Wei, Guoquan, et autres
Publié: (2026)
LVOmniBench: Pioneering Long Audio-Video Understanding Evaluation for Omnimodal LLMs
par: Tao, Keda, et autres
Publié: (2026)
par: Tao, Keda, et autres
Publié: (2026)
Improving Out-of-Domain Robustness with Targeted Augmentation in Frequency and Pixel Spaces
par: Wang, Ruoqi, et autres
Publié: (2025)
par: Wang, Ruoqi, et autres
Publié: (2025)
Robust Audio-Visual Segmentation via Audio-Guided Visual Convergent Alignment
par: Liu, Chen, et autres
Publié: (2025)
par: Liu, Chen, et autres
Publié: (2025)
Hierarchical Graph Feature Enhancement with Adaptive Frequency Modulation for Visual Recognition
par: Zhao, Feiyue, et autres
Publié: (2025)
par: Zhao, Feiyue, et autres
Publié: (2025)
IDRL: An Individual-Aware Multimodal Depression-Related Representation Learning Framework for Depression Diagnosis
par: Wang, Chongxiao, et autres
Publié: (2026)
par: Wang, Chongxiao, et autres
Publié: (2026)
Mutual Forcing: Dual-Mode Self-Evolution for Fast Autoregressive Audio-Video Character Generation
par: Zhou, Yupeng, et autres
Publié: (2026)
par: Zhou, Yupeng, et autres
Publié: (2026)
PSTNet: Enhanced Polyp Segmentation with Multi-scale Alignment and Frequency Domain Integration
par: Xu, Wenhao, et autres
Publié: (2024)
par: Xu, Wenhao, et autres
Publié: (2024)
READ-Net: Clarifying Emotional Ambiguity via Adaptive Feature Recalibration for Audio-Visual Depression Detection
par: Chen, Chenglizhao, et autres
Publié: (2026)
par: Chen, Chenglizhao, et autres
Publié: (2026)
SVDC: Consistent Direct Time-of-Flight Video Depth Completion with Frequency Selective Fusion
par: Zhu, Xuan, et autres
Publié: (2025)
par: Zhu, Xuan, et autres
Publié: (2025)
Diffusion-based Adversarial Purification from the Perspective of the Frequency Domain
par: Pei, Gaozheng, et autres
Publié: (2025)
par: Pei, Gaozheng, et autres
Publié: (2025)
Earth-Adapter: Bridge the Geospatial Domain Gaps with Mixture of Frequency Adaptation
par: Hu, Xiaoxing, et autres
Publié: (2025)
par: Hu, Xiaoxing, et autres
Publié: (2025)
Beyond Flat Text: Dual Self-inherited Guidance for Visual Text Generation
par: Luo, Minxing, et autres
Publié: (2025)
par: Luo, Minxing, et autres
Publié: (2025)
FreqGRL: Suppressing Low-Frequency Bias and Mining High-Frequency Knowledge for Cross-Domain Few-Shot Learning
par: Hui, Siqi, et autres
Publié: (2025)
par: Hui, Siqi, et autres
Publié: (2025)
When Eyes and Ears Disagree: Can MLLMs Discern Audio-Visual Confusion?
par: Ye, Qilang, et autres
Publié: (2025)
par: Ye, Qilang, et autres
Publié: (2025)
A Spatial-Frequency Aware Multi-Scale Fusion Network for Real-Time Deepfake Detection
par: Lv, Libo, et autres
Publié: (2025)
par: Lv, Libo, et autres
Publié: (2025)
FSDENet: A Frequency and Spatial Domains based Detail Enhancement Network for Remote Sensing Semantic Segmentation
par: Fu, Jiahao, et autres
Publié: (2025)
par: Fu, Jiahao, et autres
Publié: (2025)
Anomaly Detection in Electrocardiograms: Advancing Clinical Diagnosis Through Self-Supervised Learning
par: Jiang, Aofan, et autres
Publié: (2024)
par: Jiang, Aofan, et autres
Publié: (2024)
Self-supervised Anomaly Detection Pretraining Enhances Long-tail ECG Diagnosis
par: Jiang, Aofan, et autres
Publié: (2024)
par: Jiang, Aofan, et autres
Publié: (2024)
AVESFormer: Efficient Transformer Design for Real-Time Audio-Visual Segmentation
par: Wang, Zili, et autres
Publié: (2024)
par: Wang, Zili, et autres
Publié: (2024)
Breaking Watermarks in the Frequency Domain: A Modulated Diffusion Attack Framework
par: Wang, Chunpeng, et autres
Publié: (2026)
par: Wang, Chunpeng, et autres
Publié: (2026)
Dual-stream Feature Augmentation for Domain Generalization
par: Wang, Shanshan, et autres
Publié: (2024)
par: Wang, Shanshan, et autres
Publié: (2024)
Active Perception Agent for Omnimodal Audio-Video Understanding
par: Tao, Keda, et autres
Publié: (2025)
par: Tao, Keda, et autres
Publié: (2025)
Dual Structure-Aware Image Filterings for Semi-supervised Medical Image Segmentation
par: Gu, Yuliang, et autres
Publié: (2023)
par: Gu, Yuliang, et autres
Publié: (2023)
DW-DGAT: Dynamically Weighted Dual Graph Attention Network for Neurodegenerative Disease Diagnosis
par: Liang, Chengjia, et autres
Publié: (2026)
par: Liang, Chengjia, et autres
Publié: (2026)
Semantic Data Augmentation Enhanced Invariant Risk Minimization for Medical Image Domain Generalization
par: Zhu, Yaoyao, et autres
Publié: (2025)
par: Zhu, Yaoyao, et autres
Publié: (2025)
DualFast: Dual-Speedup Framework for Fast Sampling of Diffusion Models
par: Yu, Hu, et autres
Publié: (2025)
par: Yu, Hu, et autres
Publié: (2025)
Frequency Autoregressive Image Generation with Continuous Tokens
par: Yu, Hu, et autres
Publié: (2025)
par: Yu, Hu, et autres
Publié: (2025)
VABench: A Comprehensive Benchmark for Audio-Video Generation
par: Hua, Daili, et autres
Publié: (2025)
par: Hua, Daili, et autres
Publié: (2025)
DualCP: Rehearsal-Free Domain-Incremental Learning via Dual-Level Concept Prototype
par: Wang, Qiang, et autres
Publié: (2025)
par: Wang, Qiang, et autres
Publié: (2025)
KAN-Based Fusion of Dual-Domain for Audio-Driven Facial Landmarks Generation
par: Vo-Thanh, Hoang-Son, et autres
Publié: (2024)
par: Vo-Thanh, Hoang-Son, et autres
Publié: (2024)
Documents similaires
-
Towards Stable Cross-Domain Depression Recognition under Missing Modalities
par: Chen, Jiuyi, et autres
Publié: (2025) -
Semantic Audio-Visual Navigation in Continuous Environments
par: Zeng, Yichen, et autres
Publié: (2026) -
ELPG-DTFS: Prior-Guided Adaptive Time-Frequency Graph Neural Network for EEG Depression Diagnosis
par: Qiu, Jingru, et autres
Publié: (2025) -
Frequency-Domain Decomposition and Recomposition for Robust Audio-Visual Segmentation
par: Shen, Yunzhe, et autres
Publié: (2025) -
Continual Learning in the Frequency Domain
par: Liu, Ruiqi, et autres
Publié: (2024)