Gespeichert in:
| Hauptverfasser: | Bañeras-Roux, Thibault, Rouvier, Mickael, Wottawa, Jane, Dufour, Richard |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2026
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2605.03671 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
Qualitative Evaluation of Language Model Rescoring in Automatic Speech Recognition
von: Bañeras-Roux, Thibault, et al.
Veröffentlicht: (2026)
von: Bañeras-Roux, Thibault, et al.
Veröffentlicht: (2026)
A Comprehensive Analysis of Tokenization and Self-Supervised Learning in End-to-End Automatic Speech Recognition applied on French Language
von: Bañeras-Roux, Thibault, et al.
Veröffentlicht: (2026)
von: Bañeras-Roux, Thibault, et al.
Veröffentlicht: (2026)
HATS: An Open data set Integrating Human Perception Applied to the Evaluation of Automatic Speech Recognition Metrics
von: Roux, Thibault Bañeras, et al.
Veröffentlicht: (2026)
von: Roux, Thibault Bañeras, et al.
Veröffentlicht: (2026)
Evaluation of Automatic Speech Recognition Using Generative Large Language Models
von: Bañeras-Roux, Thibault, et al.
Veröffentlicht: (2026)
von: Bañeras-Roux, Thibault, et al.
Veröffentlicht: (2026)
A Benchmark of French ASR Systems Based on Error Severity
von: Tholly, Antoine, et al.
Veröffentlicht: (2025)
von: Tholly, Antoine, et al.
Veröffentlicht: (2025)
An Empirical Analysis of Discrete Unit Representations in Speech Language Modeling Pre-training
von: Labrak, Yanis, et al.
Veröffentlicht: (2025)
von: Labrak, Yanis, et al.
Veröffentlicht: (2025)
A Zero-shot and Few-shot Study of Instruction-Finetuned Large Language Models Applied to Clinical and Biomedical Tasks
von: Labrak, Yanis, et al.
Veröffentlicht: (2023)
von: Labrak, Yanis, et al.
Veröffentlicht: (2023)
Probing the Information Encoded in Neural-based Acoustic Models of Automatic Speech Recognition Systems
von: Raymondaud, Quentin, et al.
Veröffentlicht: (2024)
von: Raymondaud, Quentin, et al.
Veröffentlicht: (2024)
Zero-Shot End-To-End Spoken Question Answering In Medical Domain
von: Labrak, Yanis, et al.
Veröffentlicht: (2024)
von: Labrak, Yanis, et al.
Veröffentlicht: (2024)
How Important Is Tokenization in French Medical Masked Language Models?
von: Labrak, Yanis, et al.
Veröffentlicht: (2024)
von: Labrak, Yanis, et al.
Veröffentlicht: (2024)
BioMistral: A Collection of Open-Source Pretrained Large Language Models for Medical Domains
von: Labrak, Yanis, et al.
Veröffentlicht: (2024)
von: Labrak, Yanis, et al.
Veröffentlicht: (2024)
Asymmetric and trial-dependent modeling: the contribution of LIA to SdSV Challenge Task 2
von: Bousquet, Pierre-Michel, et al.
Veröffentlicht: (2024)
von: Bousquet, Pierre-Michel, et al.
Veröffentlicht: (2024)
Hallucinations in Neural Automatic Speech Recognition: Identifying Errors and Hallucinatory Models
von: Frieske, Rita, et al.
Veröffentlicht: (2024)
von: Frieske, Rita, et al.
Veröffentlicht: (2024)
Identifying Reliable Evaluation Metrics for Scientific Text Revision
von: Jourdan, Léane, et al.
Veröffentlicht: (2025)
von: Jourdan, Léane, et al.
Veröffentlicht: (2025)
Closing the Speech-Text Gap with Limited Audio for Effective Domain Adaptation in LLM-Based ASR
von: Bañeras-Roux, Thibault, et al.
Veröffentlicht: (2026)
von: Bañeras-Roux, Thibault, et al.
Veröffentlicht: (2026)
Automatic Speech Recognition Biases in Newcastle English: an Error Analysis
von: Serditova, Dana, et al.
Veröffentlicht: (2025)
von: Serditova, Dana, et al.
Veröffentlicht: (2025)
Responsible Benchmarking of Fairness for Automatic Speech Recognition
von: Herron, Felix, et al.
Veröffentlicht: (2026)
von: Herron, Felix, et al.
Veröffentlicht: (2026)
UCorrect: An Unsupervised Framework for Automatic Speech Recognition Error Correction
von: Guo, Jiaxin, et al.
Veröffentlicht: (2024)
von: Guo, Jiaxin, et al.
Veröffentlicht: (2024)
Error-preserving Automatic Speech Recognition of Young English Learners' Language
von: Michot, Janick, et al.
Veröffentlicht: (2024)
von: Michot, Janick, et al.
Veröffentlicht: (2024)
Late Fusion and Multi-Level Fission Amplify Cross-Modal Transfer in Text-Speech LMs
von: Cuervo, Santiago, et al.
Veröffentlicht: (2025)
von: Cuervo, Santiago, et al.
Veröffentlicht: (2025)
Automatic Speech Recognition System-Independent Word Error Rate Estimation
von: Park, Chanho, et al.
Veröffentlicht: (2024)
von: Park, Chanho, et al.
Veröffentlicht: (2024)
An Automatic Quality Metric for Evaluating Simultaneous Interpretation
von: Makinae, Mana, et al.
Veröffentlicht: (2024)
von: Makinae, Mana, et al.
Veröffentlicht: (2024)
Lost in Transcription: Identifying and Quantifying the Accuracy Biases of Automatic Speech Recognition Systems Against Disfluent Speech
von: Mujtaba, Dena, et al.
Veröffentlicht: (2024)
von: Mujtaba, Dena, et al.
Veröffentlicht: (2024)
The Role of Natural Language Processing Tasks in Automatic Literary Character Network Construction
von: Amalvy, Arthur, et al.
Veröffentlicht: (2024)
von: Amalvy, Arthur, et al.
Veröffentlicht: (2024)
Vietnamese Automatic Speech Recognition: A Revisit
von: Vu, Thi, et al.
Veröffentlicht: (2026)
von: Vu, Thi, et al.
Veröffentlicht: (2026)
Automatic Speech Recognition for the Ika Language
von: Nzenwata, Uchenna, et al.
Veröffentlicht: (2024)
von: Nzenwata, Uchenna, et al.
Veröffentlicht: (2024)
MSP-Podcast SER Challenge 2024: L'antenne du Ventoux Multimodal Self-Supervised Learning for Speech Emotion Recognition
von: Duret, Jarod, et al.
Veröffentlicht: (2024)
von: Duret, Jarod, et al.
Veröffentlicht: (2024)
The Role of Global and Local Context in Named Entity Recognition
von: Amalvy, Arthur, et al.
Veröffentlicht: (2023)
von: Amalvy, Arthur, et al.
Veröffentlicht: (2023)
DrBenchmark: A Large Language Understanding Evaluation Benchmark for French Biomedical Domain
von: Labrak, Yanis, et al.
Veröffentlicht: (2024)
von: Labrak, Yanis, et al.
Veröffentlicht: (2024)
Toward Practical Automatic Speech Recognition and Post-Processing: a Call for Explainable Error Benchmark Guideline
von: Koo, Seonmin, et al.
Veröffentlicht: (2024)
von: Koo, Seonmin, et al.
Veröffentlicht: (2024)
Error Correction by Paying Attention to Both Acoustic and Confidence References for Automatic Speech Recognition
von: Shu, Yuchun, et al.
Veröffentlicht: (2024)
von: Shu, Yuchun, et al.
Veröffentlicht: (2024)
Learning to Rank Context for Named Entity Recognition Using a Synthetic Dataset
von: Amalvy, Arthur, et al.
Veröffentlicht: (2023)
von: Amalvy, Arthur, et al.
Veröffentlicht: (2023)
Automatic Speech Recognition for Hindi
von: Saha, Anish, et al.
Veröffentlicht: (2024)
von: Saha, Anish, et al.
Veröffentlicht: (2024)
ViSpeechFormer: A Phonemic Approach for Vietnamese Automatic Speech Recognition
von: Nguyen, Khoa Anh, et al.
Veröffentlicht: (2026)
von: Nguyen, Khoa Anh, et al.
Veröffentlicht: (2026)
LipGER: Visually-Conditioned Generative Error Correction for Robust Automatic Speech Recognition
von: Ghosh, Sreyan, et al.
Veröffentlicht: (2024)
von: Ghosh, Sreyan, et al.
Veröffentlicht: (2024)
Stuttering-Aware Automatic Speech Recognition for Indonesian Language
von: Muhammad, Fadhil, et al.
Veröffentlicht: (2026)
von: Muhammad, Fadhil, et al.
Veröffentlicht: (2026)
Where Are We At with Automatic Speech Recognition for the Bambara Language?
von: Diallo, Seydou, et al.
Veröffentlicht: (2026)
von: Diallo, Seydou, et al.
Veröffentlicht: (2026)
Syllabic-Structure Decoder for Automatic Speech Recognition in Vietnamese
von: Nguyen, Nghia Hieu, et al.
Veröffentlicht: (2026)
von: Nguyen, Nghia Hieu, et al.
Veröffentlicht: (2026)
WST: Weakly Supervised Transducer for Automatic Speech Recognition
von: Gao, Dongji, et al.
Veröffentlicht: (2025)
von: Gao, Dongji, et al.
Veröffentlicht: (2025)
Quantifying the Role of Textual Predictability in Automatic Speech Recognition
von: Robertson, Sean, et al.
Veröffentlicht: (2024)
von: Robertson, Sean, et al.
Veröffentlicht: (2024)
Ähnliche Einträge
-
Qualitative Evaluation of Language Model Rescoring in Automatic Speech Recognition
von: Bañeras-Roux, Thibault, et al.
Veröffentlicht: (2026) -
A Comprehensive Analysis of Tokenization and Self-Supervised Learning in End-to-End Automatic Speech Recognition applied on French Language
von: Bañeras-Roux, Thibault, et al.
Veröffentlicht: (2026) -
HATS: An Open data set Integrating Human Perception Applied to the Evaluation of Automatic Speech Recognition Metrics
von: Roux, Thibault Bañeras, et al.
Veröffentlicht: (2026) -
Evaluation of Automatic Speech Recognition Using Generative Large Language Models
von: Bañeras-Roux, Thibault, et al.
Veröffentlicht: (2026) -
A Benchmark of French ASR Systems Based on Error Severity
von: Tholly, Antoine, et al.
Veröffentlicht: (2025)