Skip to Main content Skip to Navigation
Conference papers

Ouvrir aux linguistes « de terrain » un accès à la transcription automatique

Résumé : Le traitement automatique de la parole (TAP) commence désormais à réaliser son fort potentiel pour les tâches urgentes de description de la diversité linguistique mondiale (en déclin rapide). L’objectif du travail décrit ici consiste à mettre à la portée des praticiens de la linguistique « de terrain » (linguistes et collaborateurs) des outils de transcription automatique à la pointe des avancées technologiques. Une interface graphique conviviale, Elpis, donne accès à Kaldi et ESPnet. Les résultats sont particulièrement encourageants. D’une part, la mise au point d’une recette ESPnet à utiliser dans Elpis donne d’excellents résultats, aussi bien sur deux jeux de données précédemment utilisés pour entraîner des modèles acoustiques avec la boîte à outils Persephone qu’avec un nouveau jeu de données (langue japhug). D’autre part, l’incorporation d’ESPnet dans Elpis s’accompagne d’améliorations de l’interface utilisateur, d’une installation facilitée par conteneurisation (Docker), ainsi que de l’utilisation de processeurs graphiques (CUDA), ce qui accélère l’entraînement des modèles.
Document type :
Conference papers
Complete list of metadata

https://hal.archives-ouvertes.fr/hal-03047148
Contributor : Yannick Parmentier <>
Submitted on : Sunday, January 3, 2021 - 10:39:09 PM
Last modification on : Thursday, April 15, 2021 - 3:08:17 PM
Long-term archiving on: : Sunday, April 4, 2021 - 6:37:43 PM

Files

3.pdf
Publisher files allowed on an open archive

Identifiers

  • HAL Id : hal-03047148, version 1

Citation

Guillaume Wisniewski, Alexis Michaud, Benjamin Galliot, Laurent Besacier, Séverine Guillaume, et al.. Ouvrir aux linguistes « de terrain » un accès à la transcription automatique. 2èmes journées scientifiques du Groupement de Recherche Linguistique Informatique Formelle et de Terrain (LIFT), 2020, Montrouge, France. pp.83-94. ⟨hal-03047148⟩

Share

Metrics

Record views

198

Files downloads

37