41 |
Designing an IIR Research Apparatus with Users with Severe Intellectual Disability
|
|
|
|
In: ACM SIGIR Conference on Human Information Interaction and Retrieval (CHIIR) ; https://hal-amu.archives-ouvertes.fr/hal-02470797 ; ACM SIGIR Conference on Human Information Interaction and Retrieval (CHIIR), Mar 2020, Vancouver, Canada. pp.412-416, ⟨10.1145/3343413.3378008⟩ (2020)
|
|
BASE
|
|
Show details
|
|
42 |
Cross-lingual and cross-domain evaluation of Machine Reading Comprehension with Squad and CALOR-Quest corpora
|
|
|
|
In: Proceedings of the 12th Conference on Language Resources and Evaluation (LREC 2020) ; LREC 2020 ; https://hal.archives-ouvertes.fr/hal-02973245 ; LREC 2020, May 2020, MARSEILLE, France. pp.5491-5497 ; https://lrec2020.lrec-conf.org/en/ (2020)
|
|
BASE
|
|
Show details
|
|
43 |
Voks: Digital instruments for chironomic control of voice samples
|
|
|
|
In: ISSN: 0167-6393 ; EISSN: 1872-7182 ; Speech Communication ; https://hal.archives-ouvertes.fr/hal-03009712 ; Speech Communication, Elsevier : North-Holland, 2020, 125, pp.97 - 113. ⟨10.1016/j.specom.2020.10.002⟩ (2020)
|
|
BASE
|
|
Show details
|
|
44 |
Automatic Period Segmentation of Oral French ; Segmentation automatique du français parlé en périodes macrosyntaxiques
|
|
|
|
In: 12th International Conference on Language Resources and Evaluation ; https://hal.archives-ouvertes.fr/hal-02770725 ; 12th International Conference on Language Resources and Evaluation, May 2020, Marseille, France (2020)
|
|
BASE
|
|
Show details
|
|
45 |
Annotation syntaxique automatique de la partie orale du CEFC ; Annotation syntaxique automatique de la partie orale du CÉFC
|
|
|
|
In: ISSN: 0458-726X ; EISSN: 1958-9549 ; Langages ; https://hal.archives-ouvertes.fr/hal-02973242 ; Langages, Armand Colin (Larousse jusqu'en 2003), 2020 (2020)
|
|
BASE
|
|
Show details
|
|
46 |
Segmentation automatique en périodes pour le français parlé
|
|
|
|
In: Actes de la 6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 2 : Traitement Automatique des Langues Naturelles ; 6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 2 : Traitement Automatique des Langues Naturelles ; https://hal.archives-ouvertes.fr/hal-02784773 ; 6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 2 : Traitement Automatique des Langues Naturelles, 2020, Nancy, France. pp.241-248 (2020)
|
|
BASE
|
|
Show details
|
|
47 |
Some consideration on expressive audiovisual speech corpus acquisition using a multimodal platform
|
|
|
|
In: ISSN: 1574-020X ; EISSN: 1574-0218 ; Language Resources and Evaluation ; https://hal.archives-ouvertes.fr/hal-02907046 ; Language Resources and Evaluation, Springer Verlag, 2020, ⟨10.1007/s10579-020-09500-w⟩ ; https://link.springer.com/article/10.1007%2Fs10579-020-09500-w (2020)
|
|
BASE
|
|
Show details
|
|
48 |
DNN-Based Parametric Speech Synthesis Enhanced With Articulatory Information
|
|
|
|
In: ISSP 2020 - 12th International Seminar on Speech Production ; https://hal.inria.fr/hal-03090869 ; ISSP 2020 - 12th International Seminar on Speech Production, Dec 2020, Providence / Virtual, United States ; https://issp2020.yale.edu/ (2020)
|
|
BASE
|
|
Show details
|
|
49 |
Tracking the tongue contours in rt-MRI films with an autoencoder DNN approach
|
|
|
|
In: ISSP 2020 - 12th International Seminar on Speech Production ; https://hal.inria.fr/hal-03090859 ; ISSP 2020 - 12th International Seminar on Speech Production, Dec 2020, Providence / Virtual, United States ; https://issp2020.yale.edu/ (2020)
|
|
BASE
|
|
Show details
|
|
50 |
Vocal tract sagittal slices estimation from MRI midsagittal slices during speech production of CV
|
|
|
|
In: ISSP 2020 - 12th International Seminar on Speech Production ; https://hal.inria.fr/hal-03090865 ; ISSP 2020 - 12th International Seminar on Speech Production, Dec 2020, Providence / Virtual, United States ; https://issp2020.yale.edu/program.html (2020)
|
|
BASE
|
|
Show details
|
|
51 |
Synthesize MRI vocal tract data during CV production
|
|
|
|
In: ISSP 2020 - 12th International Seminar on Speech Production ; https://hal.inria.fr/hal-03090873 ; ISSP 2020 - 12th International Seminar on Speech Production, Dec 2020, Providence / Virtual, United States ; https://issp2020.yale.edu/ (2020)
|
|
BASE
|
|
Show details
|
|
52 |
Parametric synthesis of Arabic speech ; Synthèse paramétrique de la parole Arabe
|
|
|
|
In: https://hal.univ-lorraine.fr/tel-03050597 ; Traitement du signal et de l'image [eess.SP]. Université de Lorraine; Université de Tunis El Manar (Tunisie), 2020. Français. ⟨NNT : 2020LORR0116⟩ (2020)
|
|
Abstract:
The presented thesis deals with the adaptation of the conversion of a written text into speech using a parametric approach to the Arabic language. Different methods have been developed in order to set up synthesis systems. These methods are based on a description of the speech signal by a set of parameters. Besides, each sound is represented by a set of contextual features containing all the information affecting the pronunciation of this sound. Part of these features depend on the language and its peculiarities, so in order to adapt the parametric synthesis approach to Arabic, a study of its phonological peculiarities wasneeded. Two phenomena were identified : the gemination and the vowels quantity (short/ long). Two features associated to these phenomena have been added to the contextual features set. In the same way, different approaches have been proposed to model The geminated consonants and the long vowels of the speech units. Four combinations of modeling are possible : alternating the differentiation or fusion of simple and geminated consonants on the one hand and short and long vowels on the other hand. A set of perceptual and objective tests was conducted to evaluate the effect of the fourunit modelling approaches on the quality of the generated speech. The evaluations were made in the case of parametric synthesis by HMM then in the case of parametric synthesisby DNN. The subjective results showed that when the HMM approach is used, the four approaches produce signals with a similar quality, this result that was confirmed by the objective measures calculated to evaluate the prediction of the durations of the speech units. However, the results of objective evaluations in the case of the DNN approach have shown that the differentiation of simple consonants (respectively short vowels) geminated consonants (respectively long vowels) leads to a slightly better prediction of the durations than the other modelling approaches. On the other hand, this improvement was not perceived during the perceptive tests ; listeners found that the signals generated by the four approaches are similar in terms of overall quality. The last part of this thesis was devoted to the comparison of the synthesis approach by the HMMs to that by the DNNs.All the tests conducted have shown that the use of DNNs has improved the perceived quality of the generated signals. ; Cette thèse porte sur l’adaptation de la synthèse paramétrique de la parole à partir d’un texte écrit à la langue arabe. Pour ce faire, différentes méthodes ont été développées afin de mettre en place des systèmes de synthèse. Ces méthodes sont basées sur une description du signal de parole par un ensemble de paramètres acoustiques et prosodiques. De même, chaque son est représenté par un ensemble de descripteurs contextuels contenant toutes les informations affectant la prononciation de celui-ci. Une partie de ces descripteurs dépend de la langue et de ses particularités, ainsi, afin d'adapter l’approche de synthèse paramétrique à l’arabe, une étude des particularités phonologiques de l’arabe était nécessaire. L’accent a été mis sur deux phénomènes : la gémination et la longueur des voyelles (courte/longue). Deux descripteurs associés à ces deux phénomènes ont été ajoutés à l’ensemble des descripteurs contextuels. De même, différentes approches de choix des unités ont été proposées pour modéliser les consonnes géminées et les voyelles longues. Quatre combinaisons de modélisation sont possibles en alternant la différentiation ou la fusion des consonnes simples et géminées d’une part et des voyelles courtes et longues d’autres part. Un ensemble des tests perceptifs et objectifs a été conduit afin d’évaluer l’effet des quatre approches de modélisation des unités sur la qualité de la parole synthétisée. Les évaluations ont été faites dans le cas de synthèse paramétrique par HMM (Hidden Markov Model) puis dans le cas de la synthèse paramétrique par DNN. Les résultats subjectifs sont montrés que dans le cas de l’approche par HMM, les quatre approches produisent des signaux de qualité similaire, une conclusion qui a été confirmée par les mesures objectives calculées pour évaluer la prédiction des durées des unités de parole. Cependant, les résultats des évaluations objectives dans le cas de l’approche par DNN ont montré que la différentiation des consonnes simples (respectivement des voyelles courtes) des consonnes géminées (respectivement des voyelles longues) permet d’avoir une prédiction des durées légèrement meilleure qu’avec les autres des approches de modélisation. En revanche, cette amélioration n’a pas été perçue lors des tests perceptifs ; les participants ont trouvé que les signaux générés par les quatre approches sont similaires en termes de qualité globale. Une dernière partie de la thèse a été consacrée à la comparaison de l’approche de synthèse par HMM à celle par DNN. L’ensemble des tests conduits ont montré que l’utilisation des DNN a amélioré la qualité perçue des signaux générés.
|
|
Keyword:
[INFO.INFO-TS]Computer Science [cs]/Signal and Image Processing; Arabic language; DNN; Geminated consonants; Gémination; HMM; Langue arabe; Long vowels; Voyelles
|
|
URL: https://hal.univ-lorraine.fr/tel-03050597/document https://hal.univ-lorraine.fr/tel-03050597/file/DDOC_T_2020_0116_HOUIDHEK.pdf https://hal.univ-lorraine.fr/tel-03050597
|
|
BASE
|
|
Hide details
|
|
53 |
Parkinson's desease detection by multimodal analysis combining handwriting and speech signals ; Détection de la maladie de Parkinson par analyse multimodale combinant signaux d’écriture et de parole
|
|
|
|
In: https://tel.archives-ouvertes.fr/tel-03594895 ; Signal and Image Processing. Institut Polytechnique de Paris, 2020. English. ⟨NNT : 2020IPPAT039⟩ (2020)
|
|
BASE
|
|
Show details
|
|
54 |
Introducing the VoicePrivacy initiative
|
|
|
|
In: INTERSPEECH 2020 ; https://hal.inria.fr/hal-02562199 ; INTERSPEECH 2020, Oct 2020, Shanghai, China (2020)
|
|
BASE
|
|
Show details
|
|
55 |
Writer Identification and Script Classification. Two Tasks for a Common Understanding of Cultural Heritage
|
|
|
|
In: ISSN: 1867-9617 ; Manuscript cultures ; https://hal.archives-ouvertes.fr/hal-03320104 ; Manuscript cultures, SFB 950 ‘Manuskriptkulturen in Asien, Afrika und Europa’, 2020, pp.11-24 ; https://www.csmc.uni-hamburg.de/publications/mc/files/articles/mc15-02-stutzmann.pdf (2020)
|
|
BASE
|
|
Show details
|
|
56 |
A comparative study of speech anonymization metrics
|
|
|
|
In: INTERSPEECH 2020 ; https://hal.inria.fr/hal-02907918 ; INTERSPEECH 2020, Oct 2020, Shanghai, China (2020)
|
|
BASE
|
|
Show details
|
|
57 |
Annotating Multimodal data of Singing and Speaking
|
|
|
|
In: The Routledge Companion to Interdisciplinary Studies in Singing ; https://hal.archives-ouvertes.fr/hal-02869809 ; Frank A. Russo; Beatriz Ilari; Annabel J. Cohen. The Routledge Companion to Interdisciplinary Studies in Singing, I, Routledge, 2020, Development, 9781315163734 ; https://www.taylorfrancis.com/books/e/9781315163734/chapters/10.4324/9781315163734-11 (2020)
|
|
BASE
|
|
Show details
|
|
58 |
CHiME-6 Challenge: Tackling multispeaker speech recognition for unsegmented recordings
|
|
|
|
In: CHiME 2020 - 6th International Workshop on Speech Processing in Everyday Environments ; https://hal.inria.fr/hal-02546993 ; CHiME 2020 - 6th International Workshop on Speech Processing in Everyday Environments, May 2020, Barcelona / Virtual, Spain (2020)
|
|
BASE
|
|
Show details
|
|
59 |
Duration modelling and evaluation for Arabic statistical parametric speech synthesis
|
|
|
|
In: ISSN: 1380-7501 ; EISSN: 1573-7721 ; Multimedia Tools and Applications ; https://hal.inria.fr/hal-03007287 ; Multimedia Tools and Applications, Springer Verlag, 2020, ⟨10.1007/s11042-020-09901-7⟩ (2020)
|
|
BASE
|
|
Show details
|
|
60 |
A Data-Efficient End-to-End Spoken Language Understanding Architecture
|
|
|
|
In: International Conference on Acoustics, Speech, and Signal Processing (ICASSP) ; https://hal.archives-ouvertes.fr/hal-03094850 ; International Conference on Acoustics, Speech, and Signal Processing (ICASSP), May 2020, Barcellone, Spain (2020)
|
|
BASE
|
|
Show details
|
|
|
|