Enregistré dans:
| Auteurs principaux: | Chua, ChenYi, Wong, JunKai, Chen, Chengxin, Miao, Xiaoxiao |
|---|---|
| Format: | Preprint |
| Publié: |
2025
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2508.20796 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
MERaLiON-SER: Robust Speech Emotion Recognition Model for English and SEA Languages
par: Sailor, Hardik B., et autres
Publié: (2025)
par: Sailor, Hardik B., et autres
Publié: (2025)
Smark: A Watermark for Text-to-Speech Diffusion Models via Discrete Wavelet Transform
par: Zhang, Yichuan, et autres
Publié: (2025)
par: Zhang, Yichuan, et autres
Publié: (2025)
Leveraging Speech PTM, Text LLM, and Emotional TTS for Speech Emotion Recognition
par: Ma, Ziyang, et autres
Publié: (2023)
par: Ma, Ziyang, et autres
Publié: (2023)
Breaking Resource Barriers in Speech Emotion Recognition via Data Distillation
par: Chang, Yi, et autres
Publié: (2024)
par: Chang, Yi, et autres
Publié: (2024)
Color-based Emotion Representation for Speech Emotion Recognition
par: Nagase, Ryotaro, et autres
Publié: (2026)
par: Nagase, Ryotaro, et autres
Publié: (2026)
RAS: a Reliability Oriented Metric for Automatic Speech Recognition
par: Huang, Wenbin, et autres
Publié: (2026)
par: Huang, Wenbin, et autres
Publié: (2026)
Toward Efficient Speech Emotion Recognition via Spectral Learning and Attention
par: Lee, HyeYoung, et autres
Publié: (2025)
par: Lee, HyeYoung, et autres
Publié: (2025)
Deep Learning for Speech Emotion Recognition: A CNN Approach Utilizing Mel Spectrograms
par: Penumajji, Niketa
Publié: (2025)
par: Penumajji, Niketa
Publié: (2025)
Hybrid CNN-Transformer Architecture for Arabic Speech Emotion Recognition
par: Gheffari, Youcef Soufiane, et autres
Publié: (2026)
par: Gheffari, Youcef Soufiane, et autres
Publié: (2026)
TRNet: Two-level Refinement Network leveraging Speech Enhancement for Noise Robust Speech Emotion Recognition
par: Chen, Chengxin, et autres
Publié: (2024)
par: Chen, Chengxin, et autres
Publié: (2024)
EMO-TTA: Improving Test-Time Adaptation of Audio-Language Models for Speech Emotion Recognition
par: Shi, Jiacheng, et autres
Publié: (2025)
par: Shi, Jiacheng, et autres
Publié: (2025)
Persian Speech Emotion Recognition by Fine-Tuning Transformers
par: Shayaninasab, Minoo, et autres
Publié: (2024)
par: Shayaninasab, Minoo, et autres
Publié: (2024)
Unifying Speech Editing Detection and Content Localization via Prior-Enhanced Audio LLMs
par: Xue, Jun, et autres
Publié: (2026)
par: Xue, Jun, et autres
Publié: (2026)
MATER: Multi-level Acoustic and Textual Emotion Representation for Interpretable Speech Emotion Recognition
par: Jon, Hyo Jin, et autres
Publié: (2025)
par: Jon, Hyo Jin, et autres
Publié: (2025)
Efficient Finetuning for Dimensional Speech Emotion Recognition in the Age of Transformers
par: Sampath, Aneesha, et autres
Publié: (2025)
par: Sampath, Aneesha, et autres
Publié: (2025)
PTS-SNN: A Prompt-Tuned Temporal Shift Spiking Neural Networks for Efficient Speech Emotion Recognition
par: Su, Xun, et autres
Publié: (2026)
par: Su, Xun, et autres
Publié: (2026)
Leveraging Contrastive Learning and Self-Training for Multimodal Emotion Recognition with Limited Labeled Samples
par: Fan, Qi, et autres
Publié: (2024)
par: Fan, Qi, et autres
Publié: (2024)
EmoBox: Multilingual Multi-corpus Speech Emotion Recognition Toolkit and Benchmark
par: Ma, Ziyang, et autres
Publié: (2024)
par: Ma, Ziyang, et autres
Publié: (2024)
MSAC: Multiple Speech Attribute Control Method for Reliable Speech Emotion Recognition
par: Pan, Yu, et autres
Publié: (2023)
par: Pan, Yu, et autres
Publié: (2023)
Multi-Loss Learning for Speech Emotion Recognition with Energy-Adaptive Mixup and Frame-Level Attention
par: Wang, Cong, et autres
Publié: (2025)
par: Wang, Cong, et autres
Publié: (2025)
ABHINAYA -- A System for Speech Emotion Recognition In Naturalistic Conditions Challenge
par: Dutta, Soumya, et autres
Publié: (2025)
par: Dutta, Soumya, et autres
Publié: (2025)
Learning Physiology-Informed Vocal Spectrotemporal Representations for Speech Emotion Recognition
par: Zhang, Xu, et autres
Publié: (2026)
par: Zhang, Xu, et autres
Publié: (2026)
Active Learning with Task Adaptation Pre-training for Speech Emotion Recognition
par: Li, Dongyuan, et autres
Publié: (2024)
par: Li, Dongyuan, et autres
Publié: (2024)
VoxEmo: Benchmarking Speech Emotion Recognition with Speech LLMs
par: Zhang, Hezhao, et autres
Publié: (2026)
par: Zhang, Hezhao, et autres
Publié: (2026)
Unifying EEG and Speech for Emotion Recognition: A Two-Step Joint Learning Framework for Handling Missing EEG Data During Inference
par: Tiwari, Upasana, et autres
Publié: (2025)
par: Tiwari, Upasana, et autres
Publié: (2025)
Interactive ASR: Towards Human-Like Interaction and Semantic Coherence Evaluation for Agentic Speech Recognition
par: Wang, Peng, et autres
Publié: (2026)
par: Wang, Peng, et autres
Publié: (2026)
Amplifying Emotional Signals: Data-Efficient Deep Learning for Robust Speech Emotion Recognition
par: Vu, Tai
Publié: (2025)
par: Vu, Tai
Publié: (2025)
Channel-Aware Domain-Adaptive Generative Adversarial Network for Robust Speech Recognition
par: Wang, Chien-Chun, et autres
Publié: (2024)
par: Wang, Chien-Chun, et autres
Publié: (2024)
Enabling Automatic Disordered Speech Recognition: An Impaired Speech Dataset in the Akan Language
par: Wiafe, Isaac, et autres
Publié: (2026)
par: Wiafe, Isaac, et autres
Publié: (2026)
Improvement and Implementation of a Speech Emotion Recognition Model Based on Dual-Layer LSTM
par: Yang, Xiaoran, et autres
Publié: (2024)
par: Yang, Xiaoran, et autres
Publié: (2024)
Are you sure? Analysing Uncertainty Quantification Approaches for Real-world Speech Emotion Recognition
par: Schrüfer, Oliver, et autres
Publié: (2024)
par: Schrüfer, Oliver, et autres
Publié: (2024)
Speech Emotion Recognition Using MFCC Features and LSTM-Based Deep Learning Model
par: Oluwademilade, Adelekun, et autres
Publié: (2026)
par: Oluwademilade, Adelekun, et autres
Publié: (2026)
Explaining Deep Learning Embeddings for Speech Emotion Recognition by Predicting Interpretable Acoustic Features
par: Dixit, Satvik, et autres
Publié: (2024)
par: Dixit, Satvik, et autres
Publié: (2024)
Memo2496: Expert-Annotated Dataset and Dual-View Adaptive Framework for Music Emotion Recognition
par: Li, Qilin, et autres
Publié: (2025)
par: Li, Qilin, et autres
Publié: (2025)
Emotion-Aware Speech Generation with Character-Specific Voices for Comics
par: Qian, Zhiwen, et autres
Publié: (2025)
par: Qian, Zhiwen, et autres
Publié: (2025)
ROSE: A Recognition-Oriented Speech Enhancement Framework in Air Traffic Control Using Multi-Objective Learning
par: Yu, Xincheng, et autres
Publié: (2023)
par: Yu, Xincheng, et autres
Publié: (2023)
Bimodal Connection Attention Fusion for Speech Emotion Recognition
par: Luo, Jiachen, et autres
Publié: (2025)
par: Luo, Jiachen, et autres
Publié: (2025)
STAA-Net: A Sparse and Transferable Adversarial Attack for Speech Emotion Recognition
par: Chang, Yi, et autres
Publié: (2024)
par: Chang, Yi, et autres
Publié: (2024)
SegReConcat: A Data Augmentation Method for Voice Anonymization Attack
par: Arefeen, Ridwan, et autres
Publié: (2025)
par: Arefeen, Ridwan, et autres
Publié: (2025)
EmoSphere-SER: Enhancing Speech Emotion Recognition Through Spherical Representation with Auxiliary Classification
par: Cho, Deok-Hyeon, et autres
Publié: (2025)
par: Cho, Deok-Hyeon, et autres
Publié: (2025)
Documents similaires
-
MERaLiON-SER: Robust Speech Emotion Recognition Model for English and SEA Languages
par: Sailor, Hardik B., et autres
Publié: (2025) -
Smark: A Watermark for Text-to-Speech Diffusion Models via Discrete Wavelet Transform
par: Zhang, Yichuan, et autres
Publié: (2025) -
Leveraging Speech PTM, Text LLM, and Emotional TTS for Speech Emotion Recognition
par: Ma, Ziyang, et autres
Publié: (2023) -
Breaking Resource Barriers in Speech Emotion Recognition via Data Distillation
par: Chang, Yi, et autres
Publié: (2024) -
Color-based Emotion Representation for Speech Emotion Recognition
par: Nagase, Ryotaro, et autres
Publié: (2026)