:: Library Catalog

Kansikuva

Tallennettuna:

Bibliografiset tiedot
Päätekijät:	Hutiri, Wiebke, Cimpoi, Mircea, Scheuerman, Morgan, Matthews, Victoria, Xiang, Alice
Aineistotyyppi:	Preprint
Julkaistu:	2025
Aiheet:	Computers and Society Artificial Intelligence Audio and Speech Processing
Linkit:	https://arxiv.org/abs/2505.17841
Tagit:	Lisää tagi Ei tageja, Lisää ensimmäinen tagi!

Samankaltaisia teoksia

Not My Voice! A Taxonomy of Ethical and Safety Harms of Speech Generators
Tekijä: Hutiri, Wiebke, et al.
Julkaistu: (2024)

As Biased as You Measure: Methodological Pitfalls of Bias Evaluations in Speaker Verification Research
Tekijä: Hutiri, Wiebke, et al.
Julkaistu: (2024)

Sound Check: Auditing Audio Datasets
Tekijä: Agnew, William, et al.
Julkaistu: (2024)

How to Evaluate Automatic Speech Recognition: Comparing Different Performance and Bias Measures
Tekijä: Patel, Tanvina, et al.
Julkaistu: (2025)

Yes, But Not Always. Generative AI Needs Nuanced Opt-in
Tekijä: Hutiri, Wiebke, et al.
Julkaistu: (2026)

FairLENS: Assessing Fairness in Law Enforcement Speech Recognition
Tekijä: Wang, Yicheng, et al.
Julkaistu: (2024)

MusGO: A Community-Driven Framework For Assessing Openness in Music-Generative AI
Tekijä: Batlle-Roca, Roser, et al.
Julkaistu: (2025)

Voice EHR: Introducing Multimodal Audio Data for Health
Tekijä: Anibal, James, et al.
Julkaistu: (2024)

Synthio: Augmenting Small-Scale Audio Classification Datasets with Synthetic Data
Tekijä: Ghosh, Sreyan, et al.
Julkaistu: (2024)

IndieFake Dataset: A Benchmark Dataset for Audio Deepfake Detection
Tekijä: Kumar, Abhay, et al.
Julkaistu: (2025)

VietMed: A Dataset and Benchmark for Automatic Speech Recognition of Vietnamese in the Medical Domain
Tekijä: Le-Duc, Khai
Julkaistu: (2024)

SIFT-50M: A Large-Scale Multilingual Dataset for Speech Instruction Fine-Tuning
Tekijä: Pandey, Prabhat, et al.
Julkaistu: (2025)

Brilla AI: AI Contestant for the National Science and Maths Quiz
Tekijä: Boateng, George, et al.
Julkaistu: (2024)

The Model Hears You: Audio Language Model Deployments Should Consider the Principle of Least Privilege
Tekijä: He, Luxi, et al.
Julkaistu: (2025)

ArVoice: A Multi-Speaker Dataset for Arabic Speech Synthesis
Tekijä: Toyin, Hawau Olamide, et al.
Julkaistu: (2025)

Audio Atlas: Visualizing and Exploring Audio Datasets
Tekijä: Lanzendörfer, Luca A., et al.
Julkaistu: (2024)

Audio Deepfake Attribution: An Initial Dataset and Investigation
Tekijä: Yan, Xinrui, et al.
Julkaistu: (2022)

CryCeleb: A Speaker Verification Dataset Based on Infant Cry Sounds
Tekijä: Budaghyan, David, et al.
Julkaistu: (2023)

NOTSOFAR-1 Challenge: New Datasets, Baseline, and Tasks for Distant Meeting Transcription
Tekijä: Vinnikov, Alon, et al.
Julkaistu: (2024)

AudioTrust: Benchmarking the Multifaceted Trustworthiness of Audio Large Language Models
Tekijä: Li, Kai, et al.
Julkaistu: (2025)

The Codecfake Dataset and Countermeasures for the Universally Detection of Deepfake Audio
Tekijä: Xie, Yuankun, et al.
Julkaistu: (2024)

Heterogeneous sound classification with the Broad Sound Taxonomy and Dataset
Tekijä: Anastasopoulou, Panagiota, et al.
Julkaistu: (2024)

Cross-Domain Audio Deepfake Detection: Dataset and Analysis
Tekijä: Li, Yuang, et al.
Julkaistu: (2024)

Toward Conversational Hungarian Speech Recognition: Introducing the BEA-Large and BEA-Dialogue Datasets
Tekijä: Gedeon, Máté, et al.
Julkaistu: (2025)

QualiSpeech: A Speech Quality Assessment Dataset with Natural Language Reasoning and Descriptions
Tekijä: Wang, Siyin, et al.
Julkaistu: (2025)

Codecfake: An Initial Dataset for Detecting LLM-based Deepfake Audio
Tekijä: Lu, Yi, et al.
Julkaistu: (2024)

DroneAudioset: An Audio Dataset for Drone-based Search and Rescue
Tekijä: Gupta, Chitralekha, et al.
Julkaistu: (2025)

Towards measuring fairness in speech recognition: Fair-Speech dataset
Tekijä: Veliche, Irina-Elena, et al.
Julkaistu: (2024)

Emotion Manipulation Through Music -- A Deep Learning Interactive Visual Approach
Tekijä: Abdalla, Adel N., et al.
Julkaistu: (2024)

Towards Emotionally Consistent Text-Based Speech Editing: Introducing EmoCorrector and The ECD-TSE Dataset
Tekijä: Liu, Rui, et al.
Julkaistu: (2025)

Task-Lens: Cross-Task Utility Based Speech Dataset Profiling for Low-Resource Indian Languages
Tekijä: Sharma, Swati, et al.
Julkaistu: (2026)

Effects of Dataset Sampling Rate for Noise Cancellation through Deep Learning
Tekijä: Colelough, Brandon, et al.
Julkaistu: (2024)

GOAT: A Large Dataset of Paired Guitar Audio Recordings and Tablatures
Tekijä: Loth, Jackson, et al.
Julkaistu: (2025)

Advancing NAM-to-Speech Conversion with Novel Methods and the MultiNAM Dataset
Tekijä: Shah, Neil, et al.
Julkaistu: (2024)

A Novel Labeled Human Voice Signal Dataset for Misbehavior Detection
Tekijä: Raza, Ali, et al.
Julkaistu: (2024)

Speech-Forensics: Towards Comprehensive Synthetic Speech Dataset Establishment and Analysis
Tekijä: Ji, Zhoulin, et al.
Julkaistu: (2024)

Multi-Speaker Conversational Audio Deepfake: Taxonomy, Dataset and Pilot Study
Tekijä: Ahmed, Alabi, et al.
Julkaistu: (2026)

EchoFake: A Replay-Aware Dataset for Practical Speech Deepfake Detection
Tekijä: Zhang, Tong, et al.
Julkaistu: (2025)

Quranic Audio Dataset: Crowdsourced and Labeled Recitation from Non-Arabic Speakers
Tekijä: Salameh, Raghad, et al.
Julkaistu: (2024)

BirdSet: A Large-Scale Dataset for Audio Classification in Avian Bioacoustics
Tekijä: Rauch, Lukas, et al.
Julkaistu: (2024)