:: Library Catalog

Image de couverture de livre

Enregistré dans:

Détails bibliographiques
Auteurs principaux:	Chua, ChenYi, Wong, JunKai, Chen, Chengxin, Miao, Xiaoxiao
Format:	Preprint
Publié:	2025
Sujets:	Sound Artificial Intelligence
Accès en ligne:	https://arxiv.org/abs/2508.20796
Tags:	Ajouter un tag Pas de tags, Soyez le premier à ajouter un tag!

Documents similaires

MERaLiON-SER: Robust Speech Emotion Recognition Model for English and SEA Languages
par: Sailor, Hardik B., et autres
Publié: (2025)

Smark: A Watermark for Text-to-Speech Diffusion Models via Discrete Wavelet Transform
par: Zhang, Yichuan, et autres
Publié: (2025)

Leveraging Speech PTM, Text LLM, and Emotional TTS for Speech Emotion Recognition
par: Ma, Ziyang, et autres
Publié: (2023)

Breaking Resource Barriers in Speech Emotion Recognition via Data Distillation
par: Chang, Yi, et autres
Publié: (2024)

Color-based Emotion Representation for Speech Emotion Recognition
par: Nagase, Ryotaro, et autres
Publié: (2026)

RAS: a Reliability Oriented Metric for Automatic Speech Recognition
par: Huang, Wenbin, et autres
Publié: (2026)

Toward Efficient Speech Emotion Recognition via Spectral Learning and Attention
par: Lee, HyeYoung, et autres
Publié: (2025)

Deep Learning for Speech Emotion Recognition: A CNN Approach Utilizing Mel Spectrograms
par: Penumajji, Niketa
Publié: (2025)

Hybrid CNN-Transformer Architecture for Arabic Speech Emotion Recognition
par: Gheffari, Youcef Soufiane, et autres
Publié: (2026)

TRNet: Two-level Refinement Network leveraging Speech Enhancement for Noise Robust Speech Emotion Recognition
par: Chen, Chengxin, et autres
Publié: (2024)

EMO-TTA: Improving Test-Time Adaptation of Audio-Language Models for Speech Emotion Recognition
par: Shi, Jiacheng, et autres
Publié: (2025)

Persian Speech Emotion Recognition by Fine-Tuning Transformers
par: Shayaninasab, Minoo, et autres
Publié: (2024)

Unifying Speech Editing Detection and Content Localization via Prior-Enhanced Audio LLMs
par: Xue, Jun, et autres
Publié: (2026)

MATER: Multi-level Acoustic and Textual Emotion Representation for Interpretable Speech Emotion Recognition
par: Jon, Hyo Jin, et autres
Publié: (2025)

Efficient Finetuning for Dimensional Speech Emotion Recognition in the Age of Transformers
par: Sampath, Aneesha, et autres
Publié: (2025)

PTS-SNN: A Prompt-Tuned Temporal Shift Spiking Neural Networks for Efficient Speech Emotion Recognition
par: Su, Xun, et autres
Publié: (2026)

Leveraging Contrastive Learning and Self-Training for Multimodal Emotion Recognition with Limited Labeled Samples
par: Fan, Qi, et autres
Publié: (2024)

EmoBox: Multilingual Multi-corpus Speech Emotion Recognition Toolkit and Benchmark
par: Ma, Ziyang, et autres
Publié: (2024)

MSAC: Multiple Speech Attribute Control Method for Reliable Speech Emotion Recognition
par: Pan, Yu, et autres
Publié: (2023)

Multi-Loss Learning for Speech Emotion Recognition with Energy-Adaptive Mixup and Frame-Level Attention
par: Wang, Cong, et autres
Publié: (2025)

ABHINAYA -- A System for Speech Emotion Recognition In Naturalistic Conditions Challenge
par: Dutta, Soumya, et autres
Publié: (2025)

Learning Physiology-Informed Vocal Spectrotemporal Representations for Speech Emotion Recognition
par: Zhang, Xu, et autres
Publié: (2026)

Active Learning with Task Adaptation Pre-training for Speech Emotion Recognition
par: Li, Dongyuan, et autres
Publié: (2024)

VoxEmo: Benchmarking Speech Emotion Recognition with Speech LLMs
par: Zhang, Hezhao, et autres
Publié: (2026)

Unifying EEG and Speech for Emotion Recognition: A Two-Step Joint Learning Framework for Handling Missing EEG Data During Inference
par: Tiwari, Upasana, et autres
Publié: (2025)

Interactive ASR: Towards Human-Like Interaction and Semantic Coherence Evaluation for Agentic Speech Recognition
par: Wang, Peng, et autres
Publié: (2026)

Amplifying Emotional Signals: Data-Efficient Deep Learning for Robust Speech Emotion Recognition
par: Vu, Tai
Publié: (2025)

Channel-Aware Domain-Adaptive Generative Adversarial Network for Robust Speech Recognition
par: Wang, Chien-Chun, et autres
Publié: (2024)

Enabling Automatic Disordered Speech Recognition: An Impaired Speech Dataset in the Akan Language
par: Wiafe, Isaac, et autres
Publié: (2026)

Improvement and Implementation of a Speech Emotion Recognition Model Based on Dual-Layer LSTM
par: Yang, Xiaoran, et autres
Publié: (2024)

Are you sure? Analysing Uncertainty Quantification Approaches for Real-world Speech Emotion Recognition
par: Schrüfer, Oliver, et autres
Publié: (2024)

Speech Emotion Recognition Using MFCC Features and LSTM-Based Deep Learning Model
par: Oluwademilade, Adelekun, et autres
Publié: (2026)

Explaining Deep Learning Embeddings for Speech Emotion Recognition by Predicting Interpretable Acoustic Features
par: Dixit, Satvik, et autres
Publié: (2024)

Memo2496: Expert-Annotated Dataset and Dual-View Adaptive Framework for Music Emotion Recognition
par: Li, Qilin, et autres
Publié: (2025)

Emotion-Aware Speech Generation with Character-Specific Voices for Comics
par: Qian, Zhiwen, et autres
Publié: (2025)

ROSE: A Recognition-Oriented Speech Enhancement Framework in Air Traffic Control Using Multi-Objective Learning
par: Yu, Xincheng, et autres
Publié: (2023)

Bimodal Connection Attention Fusion for Speech Emotion Recognition
par: Luo, Jiachen, et autres
Publié: (2025)

STAA-Net: A Sparse and Transferable Adversarial Attack for Speech Emotion Recognition
par: Chang, Yi, et autres
Publié: (2024)

SegReConcat: A Data Augmentation Method for Voice Anonymization Attack
par: Arefeen, Ridwan, et autres
Publié: (2025)

EmoSphere-SER: Enhancing Speech Emotion Recognition Through Spherical Representation with Auxiliary Classification
par: Cho, Deok-Hyeon, et autres
Publié: (2025)