1 |
User-friendly automatic transcription of low-resource languages: Plugging ESPnet into Elpis
|
|
|
|
In: ComputEL-4: Fourth Workshop on the Use of Computational Methods in the Study of Endangered Languages ; https://halshs.archives-ouvertes.fr/halshs-03030529 ; ComputEL-4: Fourth Workshop on the Use of Computational Methods in the Study of Endangered Languages, Mar 2021, Hawai‘i, United States (2021)
|
|
BASE
|
|
Show details
|
|
2 |
User-friendly automatic transcription of low-resource languages: Plugging ESPnet into Elpis
|
|
|
|
In: ComputEL-4: Fourth Workshop on the Use of Computational Methods in the Study of Endangered Languages ; https://halshs.archives-ouvertes.fr/halshs-03030529 ; ComputEL-4: Fourth Workshop on the Use of Computational Methods in the Study of Endangered Languages, Mar 2021, Hawai‘i, United States (2021)
|
|
BASE
|
|
Show details
|
|
3 |
User-friendly automatic transcription of low-resource languages: Plugging ESPnet into Elpis
|
|
|
|
In: ComputEL-4: Fourth Workshop on the Use of Computational Methods in the Study of Endangered Languages ; https://halshs.archives-ouvertes.fr/halshs-03030529 ; 2020 ; https://computel-workshop.org/ (2020)
|
|
BASE
|
|
Show details
|
|
5 |
Using Automatic Speech Recognition in Spoken Corpus Curation
|
|
|
|
In: Fraunhofer IAIS (2020)
|
|
BASE
|
|
Show details
|
|
7 |
Comparison of Different Orthographies for Machine Translation of Under-Resourced Dravidian Languages
|
|
|
|
BASE
|
|
Show details
|
|
8 |
Multilingual multimodal machine translation for Dravidian languages utilizing phonetic transcription
|
|
|
|
BASE
|
|
Show details
|
|
9 |
Incorporating prosody into neural speech processing pipelines: applications on automatic speech transcription and spoken language machine translation
|
|
|
|
In: TDX (Tesis Doctorals en Xarxa) (2019)
|
|
Abstract:
In this dissertation, I study the inclusion of prosody into two applications that involve speech understanding:~automatic speech transcription and spoken language translation. In the former case, I propose a method that uses an attention mechanism over parallel sequences of prosodic and morphosyntactic features. Results indicate an $F_1$ score of 70.3\% in terms of overall punctuation generation accuracy. In the latter problem I deal with enhancing spoken language translation with prosody. A neural machine translation system trained with movie-domain data is adapted with pause features using a prosodically annotated bilingual dataset. Results show that prosodic punctuation generation as a preliminary step to translation increases translation accuracy by 1\% in terms of BLEU scores. Encoding pauses as an extra encoding feature gives an additional 1\% increase to this number. The system is further extended to jointly predict pause features in order to be used as an input to a text-to-speech system. ; En aquesta tesi estudio la inclusió de la prosòdia en dues aplicacions que involucren la comprensió de la parla:~la transcripció automàtica de la parla i la traducció de la llengua oral. En el primer cas, proposo un mètode que utilitza un mecanisme d’atenció sobre seqüències paral·leles de característiques prosòdiques i morfosintàctiques. Els resultats indiquen una precisió de $F_1$=70.3\% en la generació de la puntuació. En el segon cas m'ocupo de la millora de la traducció de la llengua oral utilitzant la prosòdia. Un sistema neural de traducció automàtica format amb un corpus de text en el domini del cinema s’adapta amb característiques de pauses afegides utilitzant un conjunt de dades bilingües prosòdicament anotada. Els resultats mostren que la generació de puntuació prosòdica com a pas previ a la traducció augmenta la precisió de la traducció en un 1\% en termes de BLEU. La codificació de les pauses com a característica addicional encara incrementa la precisió en un altre 1\%. A més a més, amplio el sistema de traducció per a predir conjuntament les característiques de pausa i poder-les utilitzar com a entrada en un sistema de síntesi de veu.
|
|
Keyword:
62; Automatic speech transcription; Bilingual spoken corpus; Corpus bilingües; Prosòdia; Prosody; Punctuation restoration; Restauració de la puntuació; Spoken language machine translation; Traducció automàtica de llenguatge oral; Transcripció automàtica de la parla
|
|
URL: http://hdl.handle.net/10803/666222
|
|
BASE
|
|
Hide details
|
|
10 |
Eesti lastekeele korpuse morfoloogilise märgendamise kitsaskohtadest
|
|
|
|
In: Eesti Rakenduslingvistika Ühingu Aastaraamat, Vol 13, Pp 205-221 (2017) (2017)
|
|
BASE
|
|
Show details
|
|
11 |
Evaluation of innovative computer-assisted transcription and translation strategies for video lecture repositories
|
|
|
|
BASE
|
|
Show details
|
|
12 |
Preliminary Experiments on Unsupervised Word Discovery in Mboshi
|
|
|
|
In: Interspeech 2016 proceedings ; Interspeech 2016 ; https://hal.archives-ouvertes.fr/hal-01350119 ; Interspeech 2016, Sep 2016, San-Francisco, United States (2016)
|
|
BASE
|
|
Show details
|
|
16 |
НЕКОТОРЫЕ АСПЕКТЫ АВТОМАТИЧЕСКОГО ТРАНСКРИБИРОВАНИЯ ДЛЯ АМЕРИКАНСКОГО ВАРИАНТА АНГЛИЙСКОГО ЯЗЫКА: ОТ ИЗОЛИРОВАННОГО СЛОВА К ТЕКСТУ
|
|
|
|
BASE
|
|
Show details
|
|
17 |
НЕКОТОРЫЕ АСПЕКТЫ АВТОМАТИЧЕСКОГО ТРАНСКРИБИРОВАНИЯ ДЛЯ АМЕРИКАНСКОГО ВАРИАНТА АНГЛИЙСКОГО ЯЗЫКА: ОТ ИЗОЛИРОВАННОГО СЛОВА К ТЕКСТУ
|
|
|
|
BASE
|
|
Show details
|
|
18 |
Multimodal interactive structured prediction
|
|
|
|
In: Riunet (2014)
|
|
BASE
|
|
Show details
|
|
|
|