:: Library Catalog

Image de couverture de livre

Enregistré dans:

Détails bibliographiques
Auteurs principaux:	Ahn, Jaehoon, Jung, Moon-Ryul
Format:	Preprint
Publié:	2025
Sujets:	Sound Artificial Intelligence Machine Learning
Accès en ligne:	https://arxiv.org/abs/2510.14391
Tags:	Ajouter un tag Pas de tags, Soyez le premier à ajouter un tag!

Documents similaires

The SMC Blind Spot: A Failure Mode Analysis of State-of-the-Art Beat Tracking
par: Ahn, Jaehoon, et autres
Publié: (2026)

AUDETER: A Large-scale Dataset for Deepfake Audio Detection in Open Worlds
par: Wang, Qizhou, et autres
Publié: (2025)

Real-Time Voicemail Detection in Telephony Audio Using Temporal Speech Activity Features
par: Saurav, Kumar
Publié: (2026)

Explainable Multi-Modal Deep Learning for Automatic Detection of Lung Diseases from Respiratory Audio Signals
par: Saky, S M Asiful Islam, et autres
Publié: (2025)

Linguistic and Audio Embedding-Based Machine Learning for Alzheimer's Dementia and Mild Cognitive Impairment Detection: Insights from the PROCESS Challenge
par: Devahi, Adharsha Sam Edwin Sam, et autres
Publié: (2025)

Alternating Approach-Putt Models for Multi-Stage Speech Enhancement
par: Jeong, Iksoon, et autres
Publié: (2025)

Automatic Music Sample Identification with Multi-Track Contrastive Learning
par: Riou, Alain, et autres
Publié: (2025)

MusicGen-Chord: Advancing Music Generation through Chord Progressions and Interactive Web-UI
par: Jung, Jongmin, et autres
Publié: (2024)

Beyond saliency: enhancing explanation of speech emotion recognition with expert-referenced acoustic cues
par: Nasr, Seham, et autres
Publié: (2025)

Preference-Based Learning in Audio Applications: A Systematic Analysis
par: Broukhim, Aaron, et autres
Publié: (2025)

Model Merging Improves Zero-Shot Generalization in Bioacoustic Foundation Models
par: Marincione, Davide, et autres
Publié: (2025)

Aria-MIDI: A Dataset of Piano MIDI Files for Symbolic Music Modeling
par: Bradshaw, Louis, et autres
Publié: (2025)

Flowing Straighter with Conditional Flow Matching for Accurate Speech Enhancement
par: Cross, Mattias, et autres
Publié: (2025)

AudioCodecBench: A Comprehensive Benchmark for Audio Codec Evaluation
par: Wang, Lu, et autres
Publié: (2025)

Who Will Top the Charts? Multimodal Music Popularity Prediction via Adaptive Fusion of Modality Experts and Temporal Engagement Modeling
par: Choudhary, Yash, et autres
Publié: (2025)

Privacy-Enhancing Infant Cry Classification with Federated Transformers and Denoising Regularization
par: Owino, Geofrey, et autres
Publié: (2025)

Hookpad Aria: A Copilot for Songwriters
par: Donahue, Chris, et autres
Publié: (2025)

DAFMSVC: One-Shot Singing Voice Conversion with Dual Attention Mechanism and Flow Matching
par: Chen, Wei, et autres
Publié: (2025)

QAMRO: Quality-aware Adaptive Margin Ranking Optimization for Human-aligned Assessment of Audio Generation Systems
par: Wang, Chien-Chun, et autres
Publié: (2025)

Survey on the Evaluation of Generative Models in Music
par: Lerch, Alexander, et autres
Publié: (2025)

Improving Underwater Acoustic Classification Through Learnable Gabor Filter Convolution and Attention Mechanisms
par: Domingos, Lucas Cesar Ferreira, et autres
Publié: (2025)

Evaluation of Deep Audio Representations for Hearables
par: Gröger, Fabian, et autres
Publié: (2025)

Explicit Context-Driven Neural Acoustic Modeling for High-Fidelity RIR Generation
par: Si, Chen, et autres
Publié: (2025)

NVSpeech: An Integrated and Scalable Pipeline for Human-Like Speech Modeling with Paralinguistic Vocalizations
par: Liao, Huan, et autres
Publié: (2025)

Myna: Masking-Based Contrastive Learning of Musical Representations
par: Yonay, Ori, et autres
Publié: (2025)

Tri-MTL: A Triple Multitask Learning Approach for Respiratory Disease Diagnosis
par: Kim, June-Woo, et autres
Publié: (2025)

SAND Challenge: Four Approaches for Dysartria Severity Classification
par: Deshpande, Gauri, et autres
Publié: (2025)

Structured-Noise Masked Modeling for Video, Audio and Beyond
par: Bhowmik, Aritra, et autres
Publié: (2025)

Lyrics Matter: Exploiting the Power of Learnt Representations for Music Popularity Prediction
par: Choudhary, Yash, et autres
Publié: (2025)

AI-Driven Acoustic Voice Biomarker-Based Hierarchical Classification of Benign Laryngeal Voice Disorders from Sustained Vowels
par: Annabestani, Mohsen, et autres
Publié: (2025)

Of All StrIPEs: Investigating Structure-informed Positional Encoding for Efficient Music Generation
par: Agarwal, Manvi, et autres
Publié: (2025)

MARS: Sound Generation via Multi-Channel Autoregression on Spectrograms
par: Ristori, Eleonora, et autres
Publié: (2025)

AUDRON: A Deep Learning Framework with Fused Acoustic Signatures for Drone Type Recognition
par: Chatterjee, Rajdeep, et autres
Publié: (2025)

Representation-Based Data Quality Audits for Audio
par: Gonzalez-Jimenez, Alvaro, et autres
Publié: (2025)

SALF-MOS: Speaker Agnostic Latent Features Downsampled for MOS Prediction
par: Agrawal, Saurabh, et autres
Publié: (2025)

Phase-Aware Deep Learning with Complex-Valued CNNs for Audio Signal Applications
par: Agrawal, Naman
Publié: (2025)

Sparse deepfake detection promotes better disentanglement
par: Teissier, Antoine, et autres
Publié: (2025)

Beyond Fixed Frames: Dynamic Character-Aligned Speech Tokenization
par: Della Libera, Luca, et autres
Publié: (2026)

DFKI-Speech System for WildSpoof Challenge: A robust framework for SASV In-the-Wild
par: Das, Arnab, et autres
Publié: (2026)

A Human-Inspired Decoupled Architecture for Efficient Audio Representation Learning
par: Kawano, Harunori, et autres
Publié: (2026)