DE eng

Search in the Catalogues and Directories

Hits 1 – 15 of 15

1
Fine-tuning pre-trained models for Automatic Speech Recognition: experiments on a fieldwork corpus of Japhug (Trans-Himalayan family)
In: https://halshs.archives-ouvertes.fr/halshs-03647315 ; 2022 (2022)
Abstract: Accepted for publication in Proceedings of ComputEL-5: Fifth Workshop on the Use of Computational Methods in the Study of Endangered Languages ; This is a report on results obtained in the development of speech recognition tools intended to support linguistic documentation efforts. The test case is an extensive fieldwork corpus of Japhug, an endangered language of the Trans-Himalayan (Sino-Tibetan) family. The goal is to reduce the transcription workload of field linguists. The method used is a deep learning approach based on the language-specific tuning of a generic pre-trained representation model, XLS-R, using a Transformer architecture. We note difficulties in implementation, in terms of learning stability. But this approach brings significant improvements nonetheless. The quality of phonemic transcription is improved over earlier experiments; and most significantly, the new approach allows for reaching the stage of automatic word recognition. Subjective evaluation of the tool by the author of the training data confirms the usefulness of this approach.
Keyword: [SHS.LANGUE]Humanities and Social Sciences/Linguistics; Automatic Speech Recognition
URL: https://halshs.archives-ouvertes.fr/halshs-03647315/file/ComputEL_5_Japhug_ASR.pdf
https://halshs.archives-ouvertes.fr/halshs-03647315/document
https://halshs.archives-ouvertes.fr/halshs-03647315
BASE
Hide details
2
Fine-tuning pre-trained models for Automatic Speech Recognition: experiments on a fieldwork corpus of Japhug (Trans-Himalayan family)
In: https://halshs.archives-ouvertes.fr/halshs-03647315 ; 2022 (2022)
BASE
Show details
3
User-friendly automatic transcription of low-resource languages: Plugging ESPnet into Elpis
In: ComputEL-4: Fourth Workshop on the Use of Computational Methods in the Study of Endangered Languages ; https://halshs.archives-ouvertes.fr/halshs-03030529 ; ComputEL-4: Fourth Workshop on the Use of Computational Methods in the Study of Endangered Languages, Mar 2021, Hawai‘i, United States (2021)
BASE
Show details
4
Yongning Na for Natural Language Processing: a single-speaker audio corpus with transcriptions ...
BASE
Show details
5
Yongning Na for Natural Language Processing: a single-speaker audio corpus with transcriptions ...
BASE
Show details
6
Japhug for Natural Language Processing: a single-speaker audio corpus with transcriptions ...
BASE
Show details
7
Japhug for Natural Language Processing: a single-speaker audio corpus with transcriptions ...
BASE
Show details
8
User-friendly automatic transcription of low-resource languages: Plugging ESPnet into Elpis
In: ComputEL-4: Fourth Workshop on the Use of Computational Methods in the Study of Endangered Languages ; https://halshs.archives-ouvertes.fr/halshs-03030529 ; ComputEL-4: Fourth Workshop on the Use of Computational Methods in the Study of Endangered Languages, Mar 2021, Hawai‘i, United States (2021)
BASE
Show details
9
La transcription du linguiste au miroir de l’intelligence artificielle : réflexions à partir de la transcription phonémique automatique
In: ISSN: 0037-9069 ; EISSN: 1783-1385 ; Bulletin de la Société de Linguistique de Paris ; https://halshs.archives-ouvertes.fr/halshs-02881731 ; Bulletin de la Société de Linguistique de Paris, Peeters Publishers, 2020, 116 (1) (2020)
BASE
Show details
10
Ouvrir aux linguistes « de terrain » un accès à la transcription automatique
In: Actes des 2èmes journées scientifiques du Groupement de Recherche Linguistique Informatique Formelle et de Terrain (LIFT). ; 2èmes journées scientifiques du Groupement de Recherche Linguistique Informatique Formelle et de Terrain (LIFT) ; https://hal.archives-ouvertes.fr/hal-03047148 ; 2èmes journées scientifiques du Groupement de Recherche Linguistique Informatique Formelle et de Terrain (LIFT), 2020, Montrouge, France. pp.83-94 (2020)
BASE
Show details
11
User-friendly automatic transcription of low-resource languages: Plugging ESPnet into Elpis
In: ComputEL-4: Fourth Workshop on the Use of Computational Methods in the Study of Endangered Languages ; https://halshs.archives-ouvertes.fr/halshs-03030529 ; 2020 ; https://computel-workshop.org/ (2020)
BASE
Show details
12
Ouvrir aux linguistes « de terrain » un accès à la transcription automatique
In: Actes des 2èmes journées scientifiques du Groupement de Recherche Linguistique Informatique Formelle et de Terrain (LIFT). ; 2èmes journées scientifiques du Groupement de Recherche Linguistique Informatique Formelle et de Terrain (LIFT) ; https://hal.archives-ouvertes.fr/hal-03047148 ; 2èmes journées scientifiques du Groupement de Recherche Linguistique Informatique Formelle et de Terrain (LIFT), 2020, Montrouge, France. pp.83-94 (2020)
BASE
Show details
13
La transcription du linguiste au miroir de l’intelligence artificielle : réflexions à partir de la transcription phonémique automatique
In: ISSN: 0037-9069 ; EISSN: 1783-1385 ; Bulletin de la Société de Linguistique de Paris ; https://halshs.archives-ouvertes.fr/halshs-02881731 ; Bulletin de la Société de Linguistique de Paris, Peeters Publishers, 2020, 116 (1) (2020)
BASE
Show details
14
Vers des ressources électroniques interconnectées : Lexica, les dictionnaires de la collection Pangloss
In: 9èmes Journées Internationales de la Linguistique de corpus ; https://halshs.archives-ouvertes.fr/halshs-01557348 ; 9èmes Journées Internationales de la Linguistique de corpus, Jul 2017, Grenoble, France. pp.48-51 ; https://jlc2017.univ-grenoble-alpes.fr/Contenu/LivretJLC2017.pdf (2017)
BASE
Show details
15
Vers des ressources électroniques interconnectées : Lexica, les dictionnaires de la collection Pangloss
In: 9èmes Journées Internationales de la Linguistique de corpus ; https://halshs.archives-ouvertes.fr/halshs-01557348 ; 9èmes Journées Internationales de la Linguistique de corpus, Jul 2017, Grenoble, France. pp.48-51 ; https://jlc2017.univ-grenoble-alpes.fr/Contenu/LivretJLC2017.pdf (2017)
BASE
Show details

Catalogues
0
0
0
0
0
0
0
Bibliographies
0
0
0
0
0
0
0
0
0
Linked Open Data catalogues
0
Online resources
0
0
0
0
Open access documents
15
0
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern