81 |
Développement d'un système de reconnaissance automatique de la parole en coréen avec peu de ressources annotées
|
|
|
|
In: Journées d'Etude sur la Parole ; https://hal.archives-ouvertes.fr/hal-01843404 ; Journées d'Etude sur la Parole, Jan 2014, Le Mans, France (2014)
|
|
Abstract:
Ce papier décrit le développement d'un système de reconnaissance automatique de la parole pour le coréen. Le coréen est une langue alpha-syllabique, parlée par environ 78 millions de personnes dans le monde. Le développement de ce système a été mené en utilisant très peu de données annotées manuellement. Les modèles acoustiques ont été adaptés de manière non supervisée en utilisant des données provenant de différents sites d'actualités coréens. Le corpus de développement contient des transcriptions approximatives des documents audio : il s'agit d'un corpus transcrit automatiquement et aligné avec des données provenant des mêmes sites Internet. Nous comparons différentes approches dans ce travail, à savoir, des modèles de langue utilisant des unités différentes pour l'apprentissage non supervisé et pour le décodage (des caractères et des mots avec des vocabulaires de différentes tailles), l'utilisation de phonèmes et d'unités ``demi-syllabiques'' et deux approches différentes d'apprentissage non supervisé.
|
|
Keyword:
[INFO.INFO-CL]Computer Science [cs]/Computation and Language [cs.CL]; [INFO]Computer Science [cs]; apprentissage non supervisé; langues sous doutées; Reconnaissance automatique de la parole
|
|
URL: https://hal.archives-ouvertes.fr/hal-01843404
|
|
BASE
|
|
Hide details
|
|
82 |
Modélisation acoustico-phonétique de langues peu dotées : Études phonétiques et travaux de reconnaissance automatique en luxembourgois
|
|
|
|
In: Journées d'Etude sur la Parole ; https://hal.archives-ouvertes.fr/hal-01843399 ; Journées d'Etude sur la Parole, Jan 2014, Le Mans, France (2014)
|
|
BASE
|
|
Show details
|
|
83 |
Exploring Pronunciation Variants for Romanian Speech-to-Text Transcription
|
|
|
|
In: International Workshop on Spoken Languages Technologies for Under-resourced languages ; https://hal.archives-ouvertes.fr/hal-01843413 ; International Workshop on Spoken Languages Technologies for Under-resourced languages, May 2014, St. Petersburg, Russia (2014)
|
|
BASE
|
|
Show details
|
|
84 |
Human Annotation of ASR Error Regions: is "gravity" a Sharable Concept for Human Annotators?
|
|
|
|
In: Ninth International Conference on Language Resources and Evaluation (LREC'14) ; https://hal.archives-ouvertes.fr/hal-01134802 ; Ninth International Conference on Language Resources and Evaluation (LREC'14), May 2014, Reykjavik, Iceland. Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC'14), pp.3050-3056, 2014 ; http://lrec2014.lrec-conf.org/en/ (2014)
|
|
BASE
|
|
Show details
|
|
85 |
Speech Alignment and Recognition Experiments for Luxembourgish
|
|
|
|
In: Proceedings of the 4th International Workshop on Spoken Language Technologies for Underresourced Languages ; 4th International Workshop on Spoken Language Technologies for Underresourced Languages ; https://hal.archives-ouvertes.fr/hal-01134824 ; 4th International Workshop on Spoken Language Technologies for Underresourced Languages, May 2014, Saint-Petersbourg, Russia. pp.53-60 ; http://www.mica.edu.vn/sltu2014/ (2014)
|
|
BASE
|
|
Show details
|
|
86 |
A First LVCSR System for Luxembourgish, a Low-Resourced European Language
|
|
|
|
In: Human Language Technology Challenges for Computer Science and Linguistics ; https://hal.archives-ouvertes.fr/hal-01135103 ; Zygmunt Vetulani; Joseph Mariani. Human Language Technology Challenges for Computer Science and Linguistics, 8387, Springer International Publishing, pp.479-490, 2014, 5th Language and Technology Conference, LTC 2011, Poznań, Poland, November 25--27, 2011, Revised Selected Papers, 978-3-319-08957-7. ⟨10.1007/978-3-319-08958-4_39⟩ (2014)
|
|
BASE
|
|
Show details
|
|
87 |
Language Diversity: Speech Processing In A Multi-Lingual Context
|
|
|
|
In: Annual Conference of the International Speech Communication Association ; https://hal.archives-ouvertes.fr/hal-01843419 ; Annual Conference of the International Speech Communication Association , Haizhou Li, Helen Meng, Bin Ma, Eng Siong Chng, Lei Xie, Jan 2014, Singapore, Singapore (2014)
|
|
BASE
|
|
Show details
|
|
88 |
Efficient Rule Scoring For Improved Grapheme-Based Lexicons ...
|
|
|
|
BASE
|
|
Show details
|
|
89 |
Some issues affecting the transcription of hungarian broadcast audio
|
|
|
|
In: Annual Conference of the International Speech Communication Association ; https://hal.archives-ouvertes.fr/hal-01843430 ; Annual Conference of the International Speech Communication Association , Aug 2013, Lyon, France (2013)
|
|
BASE
|
|
Show details
|
|
90 |
Acoustic unit discovery and pronunciation generation from a grapheme-based lexicon
|
|
|
|
In: IEEE Automatic Speech Recognition and Understanding Workshop ; https://hal.archives-ouvertes.fr/hal-01843433 ; IEEE Automatic Speech Recognition and Understanding Workshop, Dec 2013, Olomouc, Czech Republic (2013)
|
|
BASE
|
|
Show details
|
|
91 |
Discriminative training of a phoneme confusion model for a dynamic lexicon in ASR
|
|
|
|
In: Interspeech 2013 ; Annual Conference of the International Speech Communication Association ; https://hal.archives-ouvertes.fr/hal-01843427 ; Annual Conference of the International Speech Communication Association, Jan 2013, Lyon, France (2013)
|
|
BASE
|
|
Show details
|
|
92 |
Recent evolution of non-standard consonantal variants in French broadcast news
|
|
|
|
In: Interspeech ; https://halshs.archives-ouvertes.fr/halshs-00856290 ; Interspeech, Aug 2013, Lyon, France. pp.412-416 (2013)
|
|
BASE
|
|
Show details
|
|
93 |
Recent Evolution of Non Standard Consonantal Variants in French Broadcast News
|
|
|
|
In: Annual Conference of the International Speech Communication Association ; https://hal.archives-ouvertes.fr/hal-01843431 ; Annual Conference of the International Speech Communication Association , International Speech Communication Association, F. Bimbot, C. Cerisara, C. Fougeron, G. Gravier, L. Lamel, F. Pellegrino, P. Perrier, Jan 2013, Lyon, France (2013)
|
|
BASE
|
|
Show details
|
|
94 |
Unsupervised Acoustic Model Training with Limited Linguistic Resources
|
|
|
|
In: IEEE Automatic Speech Recognition and Understanding Workshop ; https://hal.archives-ouvertes.fr/hal-01843476 ; IEEE Automatic Speech Recognition and Understanding Workshop, Jan 2013, Olomouc, Czech Republic (2013)
|
|
BASE
|
|
Show details
|
|
95 |
What we can learn from ASR errors about low-resourced languages: a case- study of Luxembourgish and Austrian
|
|
|
|
In: Errors by Humans and Machines in Multimedia, Multimodal, Multilingual Data Processing ; https://hal.archives-ouvertes.fr/hal-01843440 ; Errors by Humans and Machines in Multimedia, Multimodal, Multilingual Data Processing, Jan 2013, Ermenonville, France (2013)
|
|
BASE
|
|
Show details
|
|
96 |
Embosi: automatic alignment with segments and words and phonological mining
|
|
|
|
In: International Conference on Bantu Languages ; https://hal.archives-ouvertes.fr/hal-01843438 ; International Conference on Bantu Languages, Jan 2013, Paris, France (2013)
|
|
BASE
|
|
Show details
|
|
97 |
What we can learn from asr errors about low-resourced languages: a case-study of luxembourgish and austrian
|
|
|
|
In: Errors by Humans and Machines in Multimedia, Multimodal, Multilingual Data Processing (ERRARE 2013) ; https://halshs.archives-ouvertes.fr/halshs-01424902 ; Errors by Humans and Machines in Multimedia, Multimodal, Multilingual Data Processing (ERRARE 2013), Nov 2013, Ermenonville, France (2013)
|
|
BASE
|
|
Show details
|
|
98 |
Embosi : automatic alignment with segments and words and phonological mining
|
|
|
|
In: International Conference on Bantu Languages (BANTU 2013) ; https://halshs.archives-ouvertes.fr/halshs-01424894 ; International Conference on Bantu Languages (BANTU 2013), Jun 2013, Paris France (2013)
|
|
BASE
|
|
Show details
|
|
99 |
Human annotation of asr error regions: Is ”gravity” a sharable concept for human annotators?
|
|
|
|
In: Errors by Humans and Machines in Multimedia, Multimodal, Multilingual Data Processing (ERRARE 2013) ; https://halshs.archives-ouvertes.fr/halshs-01424915 ; Errors by Humans and Machines in Multimedia, Multimodal, Multilingual Data Processing (ERRARE 2013), Nov 2013, Ermenonville, France (2013)
|
|
BASE
|
|
Show details
|
|
100 |
Systèmes de transcription comme instruments
|
|
|
|
In: Méthodes et outils pour l'analyse phonétique des grands corpus oraux ; https://hal.archives-ouvertes.fr/hal-01135113 ; Nguyen Noël; Adda-Decker Martine. Méthodes et outils pour l'analyse phonétique des grands corpus oraux, Hermes Science Publications, pp.159-202, 2013, Cognition et Traitement de l'Information, 978-2746245303 (2013)
|
|
BASE
|
|
Show details
|
|
|
|