Tallennettuna:
| Päätekijät: | Hutiri, Wiebke, Cimpoi, Mircea, Scheuerman, Morgan, Matthews, Victoria, Xiang, Alice |
|---|---|
| Aineistotyyppi: | Preprint |
| Julkaistu: |
2025
|
| Aiheet: | |
| Linkit: | https://arxiv.org/abs/2505.17841 |
| Tagit: |
Lisää tagi
Ei tageja, Lisää ensimmäinen tagi!
|
Samankaltaisia teoksia
Not My Voice! A Taxonomy of Ethical and Safety Harms of Speech Generators
Tekijä: Hutiri, Wiebke, et al.
Julkaistu: (2024)
Tekijä: Hutiri, Wiebke, et al.
Julkaistu: (2024)
As Biased as You Measure: Methodological Pitfalls of Bias Evaluations in Speaker Verification Research
Tekijä: Hutiri, Wiebke, et al.
Julkaistu: (2024)
Tekijä: Hutiri, Wiebke, et al.
Julkaistu: (2024)
Sound Check: Auditing Audio Datasets
Tekijä: Agnew, William, et al.
Julkaistu: (2024)
Tekijä: Agnew, William, et al.
Julkaistu: (2024)
How to Evaluate Automatic Speech Recognition: Comparing Different Performance and Bias Measures
Tekijä: Patel, Tanvina, et al.
Julkaistu: (2025)
Tekijä: Patel, Tanvina, et al.
Julkaistu: (2025)
Yes, But Not Always. Generative AI Needs Nuanced Opt-in
Tekijä: Hutiri, Wiebke, et al.
Julkaistu: (2026)
Tekijä: Hutiri, Wiebke, et al.
Julkaistu: (2026)
FairLENS: Assessing Fairness in Law Enforcement Speech Recognition
Tekijä: Wang, Yicheng, et al.
Julkaistu: (2024)
Tekijä: Wang, Yicheng, et al.
Julkaistu: (2024)
MusGO: A Community-Driven Framework For Assessing Openness in Music-Generative AI
Tekijä: Batlle-Roca, Roser, et al.
Julkaistu: (2025)
Tekijä: Batlle-Roca, Roser, et al.
Julkaistu: (2025)
Voice EHR: Introducing Multimodal Audio Data for Health
Tekijä: Anibal, James, et al.
Julkaistu: (2024)
Tekijä: Anibal, James, et al.
Julkaistu: (2024)
Synthio: Augmenting Small-Scale Audio Classification Datasets with Synthetic Data
Tekijä: Ghosh, Sreyan, et al.
Julkaistu: (2024)
Tekijä: Ghosh, Sreyan, et al.
Julkaistu: (2024)
IndieFake Dataset: A Benchmark Dataset for Audio Deepfake Detection
Tekijä: Kumar, Abhay, et al.
Julkaistu: (2025)
Tekijä: Kumar, Abhay, et al.
Julkaistu: (2025)
VietMed: A Dataset and Benchmark for Automatic Speech Recognition of Vietnamese in the Medical Domain
Tekijä: Le-Duc, Khai
Julkaistu: (2024)
Tekijä: Le-Duc, Khai
Julkaistu: (2024)
SIFT-50M: A Large-Scale Multilingual Dataset for Speech Instruction Fine-Tuning
Tekijä: Pandey, Prabhat, et al.
Julkaistu: (2025)
Tekijä: Pandey, Prabhat, et al.
Julkaistu: (2025)
Brilla AI: AI Contestant for the National Science and Maths Quiz
Tekijä: Boateng, George, et al.
Julkaistu: (2024)
Tekijä: Boateng, George, et al.
Julkaistu: (2024)
The Model Hears You: Audio Language Model Deployments Should Consider the Principle of Least Privilege
Tekijä: He, Luxi, et al.
Julkaistu: (2025)
Tekijä: He, Luxi, et al.
Julkaistu: (2025)
ArVoice: A Multi-Speaker Dataset for Arabic Speech Synthesis
Tekijä: Toyin, Hawau Olamide, et al.
Julkaistu: (2025)
Tekijä: Toyin, Hawau Olamide, et al.
Julkaistu: (2025)
Audio Atlas: Visualizing and Exploring Audio Datasets
Tekijä: Lanzendörfer, Luca A., et al.
Julkaistu: (2024)
Tekijä: Lanzendörfer, Luca A., et al.
Julkaistu: (2024)
Audio Deepfake Attribution: An Initial Dataset and Investigation
Tekijä: Yan, Xinrui, et al.
Julkaistu: (2022)
Tekijä: Yan, Xinrui, et al.
Julkaistu: (2022)
CryCeleb: A Speaker Verification Dataset Based on Infant Cry Sounds
Tekijä: Budaghyan, David, et al.
Julkaistu: (2023)
Tekijä: Budaghyan, David, et al.
Julkaistu: (2023)
NOTSOFAR-1 Challenge: New Datasets, Baseline, and Tasks for Distant Meeting Transcription
Tekijä: Vinnikov, Alon, et al.
Julkaistu: (2024)
Tekijä: Vinnikov, Alon, et al.
Julkaistu: (2024)
AudioTrust: Benchmarking the Multifaceted Trustworthiness of Audio Large Language Models
Tekijä: Li, Kai, et al.
Julkaistu: (2025)
Tekijä: Li, Kai, et al.
Julkaistu: (2025)
The Codecfake Dataset and Countermeasures for the Universally Detection of Deepfake Audio
Tekijä: Xie, Yuankun, et al.
Julkaistu: (2024)
Tekijä: Xie, Yuankun, et al.
Julkaistu: (2024)
Heterogeneous sound classification with the Broad Sound Taxonomy and Dataset
Tekijä: Anastasopoulou, Panagiota, et al.
Julkaistu: (2024)
Tekijä: Anastasopoulou, Panagiota, et al.
Julkaistu: (2024)
Cross-Domain Audio Deepfake Detection: Dataset and Analysis
Tekijä: Li, Yuang, et al.
Julkaistu: (2024)
Tekijä: Li, Yuang, et al.
Julkaistu: (2024)
Toward Conversational Hungarian Speech Recognition: Introducing the BEA-Large and BEA-Dialogue Datasets
Tekijä: Gedeon, Máté, et al.
Julkaistu: (2025)
Tekijä: Gedeon, Máté, et al.
Julkaistu: (2025)
QualiSpeech: A Speech Quality Assessment Dataset with Natural Language Reasoning and Descriptions
Tekijä: Wang, Siyin, et al.
Julkaistu: (2025)
Tekijä: Wang, Siyin, et al.
Julkaistu: (2025)
Codecfake: An Initial Dataset for Detecting LLM-based Deepfake Audio
Tekijä: Lu, Yi, et al.
Julkaistu: (2024)
Tekijä: Lu, Yi, et al.
Julkaistu: (2024)
DroneAudioset: An Audio Dataset for Drone-based Search and Rescue
Tekijä: Gupta, Chitralekha, et al.
Julkaistu: (2025)
Tekijä: Gupta, Chitralekha, et al.
Julkaistu: (2025)
Towards measuring fairness in speech recognition: Fair-Speech dataset
Tekijä: Veliche, Irina-Elena, et al.
Julkaistu: (2024)
Tekijä: Veliche, Irina-Elena, et al.
Julkaistu: (2024)
Emotion Manipulation Through Music -- A Deep Learning Interactive Visual Approach
Tekijä: Abdalla, Adel N., et al.
Julkaistu: (2024)
Tekijä: Abdalla, Adel N., et al.
Julkaistu: (2024)
Towards Emotionally Consistent Text-Based Speech Editing: Introducing EmoCorrector and The ECD-TSE Dataset
Tekijä: Liu, Rui, et al.
Julkaistu: (2025)
Tekijä: Liu, Rui, et al.
Julkaistu: (2025)
Task-Lens: Cross-Task Utility Based Speech Dataset Profiling for Low-Resource Indian Languages
Tekijä: Sharma, Swati, et al.
Julkaistu: (2026)
Tekijä: Sharma, Swati, et al.
Julkaistu: (2026)
Effects of Dataset Sampling Rate for Noise Cancellation through Deep Learning
Tekijä: Colelough, Brandon, et al.
Julkaistu: (2024)
Tekijä: Colelough, Brandon, et al.
Julkaistu: (2024)
GOAT: A Large Dataset of Paired Guitar Audio Recordings and Tablatures
Tekijä: Loth, Jackson, et al.
Julkaistu: (2025)
Tekijä: Loth, Jackson, et al.
Julkaistu: (2025)
Advancing NAM-to-Speech Conversion with Novel Methods and the MultiNAM Dataset
Tekijä: Shah, Neil, et al.
Julkaistu: (2024)
Tekijä: Shah, Neil, et al.
Julkaistu: (2024)
A Novel Labeled Human Voice Signal Dataset for Misbehavior Detection
Tekijä: Raza, Ali, et al.
Julkaistu: (2024)
Tekijä: Raza, Ali, et al.
Julkaistu: (2024)
Speech-Forensics: Towards Comprehensive Synthetic Speech Dataset Establishment and Analysis
Tekijä: Ji, Zhoulin, et al.
Julkaistu: (2024)
Tekijä: Ji, Zhoulin, et al.
Julkaistu: (2024)
Multi-Speaker Conversational Audio Deepfake: Taxonomy, Dataset and Pilot Study
Tekijä: Ahmed, Alabi, et al.
Julkaistu: (2026)
Tekijä: Ahmed, Alabi, et al.
Julkaistu: (2026)
EchoFake: A Replay-Aware Dataset for Practical Speech Deepfake Detection
Tekijä: Zhang, Tong, et al.
Julkaistu: (2025)
Tekijä: Zhang, Tong, et al.
Julkaistu: (2025)
Quranic Audio Dataset: Crowdsourced and Labeled Recitation from Non-Arabic Speakers
Tekijä: Salameh, Raghad, et al.
Julkaistu: (2024)
Tekijä: Salameh, Raghad, et al.
Julkaistu: (2024)
BirdSet: A Large-Scale Dataset for Audio Classification in Avian Bioacoustics
Tekijä: Rauch, Lukas, et al.
Julkaistu: (2024)
Tekijä: Rauch, Lukas, et al.
Julkaistu: (2024)
Samankaltaisia teoksia
-
Not My Voice! A Taxonomy of Ethical and Safety Harms of Speech Generators
Tekijä: Hutiri, Wiebke, et al.
Julkaistu: (2024) -
As Biased as You Measure: Methodological Pitfalls of Bias Evaluations in Speaker Verification Research
Tekijä: Hutiri, Wiebke, et al.
Julkaistu: (2024) -
Sound Check: Auditing Audio Datasets
Tekijä: Agnew, William, et al.
Julkaistu: (2024) -
How to Evaluate Automatic Speech Recognition: Comparing Different Performance and Bias Measures
Tekijä: Patel, Tanvina, et al.
Julkaistu: (2025) -
Yes, But Not Always. Generative AI Needs Nuanced Opt-in
Tekijä: Hutiri, Wiebke, et al.
Julkaistu: (2026)