DE eng

Search in the Catalogues and Directories

Page: 1 2 3 4 5 6 7...22
Hits 41 – 60 of 431

41
Designing an IIR Research Apparatus with Users with Severe Intellectual Disability
In: ACM SIGIR Conference on Human Information Interaction and Retrieval (CHIIR) ; https://hal-amu.archives-ouvertes.fr/hal-02470797 ; ACM SIGIR Conference on Human Information Interaction and Retrieval (CHIIR), Mar 2020, Vancouver, Canada. pp.412-416, ⟨10.1145/3343413.3378008⟩ (2020)
BASE
Show details
42
Cross-lingual and cross-domain evaluation of Machine Reading Comprehension with Squad and CALOR-Quest corpora
In: Proceedings of the 12th Conference on Language Resources and Evaluation (LREC 2020) ; LREC 2020 ; https://hal.archives-ouvertes.fr/hal-02973245 ; LREC 2020, May 2020, MARSEILLE, France. pp.5491-5497 ; https://lrec2020.lrec-conf.org/en/ (2020)
BASE
Show details
43
Voks: Digital instruments for chironomic control of voice samples
In: ISSN: 0167-6393 ; EISSN: 1872-7182 ; Speech Communication ; https://hal.archives-ouvertes.fr/hal-03009712 ; Speech Communication, Elsevier : North-Holland, 2020, 125, pp.97 - 113. ⟨10.1016/j.specom.2020.10.002⟩ (2020)
BASE
Show details
44
Automatic Period Segmentation of Oral French ; Segmentation automatique du français parlé en périodes macrosyntaxiques
In: 12th International Conference on Language Resources and Evaluation ; https://hal.archives-ouvertes.fr/hal-02770725 ; 12th International Conference on Language Resources and Evaluation, May 2020, Marseille, France (2020)
BASE
Show details
45
Annotation syntaxique automatique de la partie orale du CEFC ; Annotation syntaxique automatique de la partie orale du CÉFC
In: ISSN: 0458-726X ; EISSN: 1958-9549 ; Langages ; https://hal.archives-ouvertes.fr/hal-02973242 ; Langages, Armand Colin (Larousse jusqu'en 2003), 2020 (2020)
BASE
Show details
46
Segmentation automatique en périodes pour le français parlé
In: Actes de la 6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 2 : Traitement Automatique des Langues Naturelles ; 6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 2 : Traitement Automatique des Langues Naturelles ; https://hal.archives-ouvertes.fr/hal-02784773 ; 6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 2 : Traitement Automatique des Langues Naturelles, 2020, Nancy, France. pp.241-248 (2020)
BASE
Show details
47
Some consideration on expressive audiovisual speech corpus acquisition using a multimodal platform
In: ISSN: 1574-020X ; EISSN: 1574-0218 ; Language Resources and Evaluation ; https://hal.archives-ouvertes.fr/hal-02907046 ; Language Resources and Evaluation, Springer Verlag, 2020, ⟨10.1007/s10579-020-09500-w⟩ ; https://link.springer.com/article/10.1007%2Fs10579-020-09500-w (2020)
BASE
Show details
48
DNN-Based Parametric Speech Synthesis Enhanced With Articulatory Information
In: ISSP 2020 - 12th International Seminar on Speech Production ; https://hal.inria.fr/hal-03090869 ; ISSP 2020 - 12th International Seminar on Speech Production, Dec 2020, Providence / Virtual, United States ; https://issp2020.yale.edu/ (2020)
BASE
Show details
49
Tracking the tongue contours in rt-MRI films with an autoencoder DNN approach
In: ISSP 2020 - 12th International Seminar on Speech Production ; https://hal.inria.fr/hal-03090859 ; ISSP 2020 - 12th International Seminar on Speech Production, Dec 2020, Providence / Virtual, United States ; https://issp2020.yale.edu/ (2020)
BASE
Show details
50
Vocal tract sagittal slices estimation from MRI midsagittal slices during speech production of CV
In: ISSP 2020 - 12th International Seminar on Speech Production ; https://hal.inria.fr/hal-03090865 ; ISSP 2020 - 12th International Seminar on Speech Production, Dec 2020, Providence / Virtual, United States ; https://issp2020.yale.edu/program.html (2020)
BASE
Show details
51
Synthesize MRI vocal tract data during CV production
In: ISSP 2020 - 12th International Seminar on Speech Production ; https://hal.inria.fr/hal-03090873 ; ISSP 2020 - 12th International Seminar on Speech Production, Dec 2020, Providence / Virtual, United States ; https://issp2020.yale.edu/ (2020)
BASE
Show details
52
Parametric synthesis of Arabic speech ; Synthèse paramétrique de la parole Arabe
Houidhek, Amal. - : HAL CCSD, 2020
In: https://hal.univ-lorraine.fr/tel-03050597 ; Traitement du signal et de l'image [eess.SP]. Université de Lorraine; Université de Tunis El Manar (Tunisie), 2020. Français. ⟨NNT : 2020LORR0116⟩ (2020)
Abstract: The presented thesis deals with the adaptation of the conversion of a written text into speech using a parametric approach to the Arabic language. Different methods have been developed in order to set up synthesis systems. These methods are based on a description of the speech signal by a set of parameters. Besides, each sound is represented by a set of contextual features containing all the information affecting the pronunciation of this sound. Part of these features depend on the language and its peculiarities, so in order to adapt the parametric synthesis approach to Arabic, a study of its phonological peculiarities wasneeded. Two phenomena were identified : the gemination and the vowels quantity (short/ long). Two features associated to these phenomena have been added to the contextual features set. In the same way, different approaches have been proposed to model The geminated consonants and the long vowels of the speech units. Four combinations of modeling are possible : alternating the differentiation or fusion of simple and geminated consonants on the one hand and short and long vowels on the other hand. A set of perceptual and objective tests was conducted to evaluate the effect of the fourunit modelling approaches on the quality of the generated speech. The evaluations were made in the case of parametric synthesis by HMM then in the case of parametric synthesisby DNN. The subjective results showed that when the HMM approach is used, the four approaches produce signals with a similar quality, this result that was confirmed by the objective measures calculated to evaluate the prediction of the durations of the speech units. However, the results of objective evaluations in the case of the DNN approach have shown that the differentiation of simple consonants (respectively short vowels) geminated consonants (respectively long vowels) leads to a slightly better prediction of the durations than the other modelling approaches. On the other hand, this improvement was not perceived during the perceptive tests ; listeners found that the signals generated by the four approaches are similar in terms of overall quality. The last part of this thesis was devoted to the comparison of the synthesis approach by the HMMs to that by the DNNs.All the tests conducted have shown that the use of DNNs has improved the perceived quality of the generated signals. ; Cette thèse porte sur l’adaptation de la synthèse paramétrique de la parole à partir d’un texte écrit à la langue arabe. Pour ce faire, différentes méthodes ont été développées afin de mettre en place des systèmes de synthèse. Ces méthodes sont basées sur une description du signal de parole par un ensemble de paramètres acoustiques et prosodiques. De même, chaque son est représenté par un ensemble de descripteurs contextuels contenant toutes les informations affectant la prononciation de celui-ci. Une partie de ces descripteurs dépend de la langue et de ses particularités, ainsi, afin d'adapter l’approche de synthèse paramétrique à l’arabe, une étude des particularités phonologiques de l’arabe était nécessaire. L’accent a été mis sur deux phénomènes : la gémination et la longueur des voyelles (courte/longue). Deux descripteurs associés à ces deux phénomènes ont été ajoutés à l’ensemble des descripteurs contextuels. De même, différentes approches de choix des unités ont été proposées pour modéliser les consonnes géminées et les voyelles longues. Quatre combinaisons de modélisation sont possibles en alternant la différentiation ou la fusion des consonnes simples et géminées d’une part et des voyelles courtes et longues d’autres part. Un ensemble des tests perceptifs et objectifs a été conduit afin d’évaluer l’effet des quatre approches de modélisation des unités sur la qualité de la parole synthétisée. Les évaluations ont été faites dans le cas de synthèse paramétrique par HMM (Hidden Markov Model) puis dans le cas de la synthèse paramétrique par DNN. Les résultats subjectifs sont montrés que dans le cas de l’approche par HMM, les quatre approches produisent des signaux de qualité similaire, une conclusion qui a été confirmée par les mesures objectives calculées pour évaluer la prédiction des durées des unités de parole. Cependant, les résultats des évaluations objectives dans le cas de l’approche par DNN ont montré que la différentiation des consonnes simples (respectivement des voyelles courtes) des consonnes géminées (respectivement des voyelles longues) permet d’avoir une prédiction des durées légèrement meilleure qu’avec les autres des approches de modélisation. En revanche, cette amélioration n’a pas été perçue lors des tests perceptifs ; les participants ont trouvé que les signaux générés par les quatre approches sont similaires en termes de qualité globale. Une dernière partie de la thèse a été consacrée à la comparaison de l’approche de synthèse par HMM à celle par DNN. L’ensemble des tests conduits ont montré que l’utilisation des DNN a amélioré la qualité perçue des signaux générés.
Keyword: [INFO.INFO-TS]Computer Science [cs]/Signal and Image Processing; Arabic language; DNN; Geminated consonants; Gémination; HMM; Langue arabe; Long vowels; Voyelles
URL: https://hal.univ-lorraine.fr/tel-03050597/document
https://hal.univ-lorraine.fr/tel-03050597/file/DDOC_T_2020_0116_HOUIDHEK.pdf
https://hal.univ-lorraine.fr/tel-03050597
BASE
Hide details
53
Parkinson's desease detection by multimodal analysis combining handwriting and speech signals ; Détection de la maladie de Parkinson par analyse multimodale combinant signaux d’écriture et de parole
Taleb, Catherine. - : HAL CCSD, 2020
In: https://tel.archives-ouvertes.fr/tel-03594895 ; Signal and Image Processing. Institut Polytechnique de Paris, 2020. English. ⟨NNT : 2020IPPAT039⟩ (2020)
BASE
Show details
54
Introducing the VoicePrivacy initiative
In: INTERSPEECH 2020 ; https://hal.inria.fr/hal-02562199 ; INTERSPEECH 2020, Oct 2020, Shanghai, China (2020)
BASE
Show details
55
Writer Identification and Script Classification. Two Tasks for a Common Understanding of Cultural Heritage
In: ISSN: 1867-9617 ; Manuscript cultures ; https://hal.archives-ouvertes.fr/hal-03320104 ; Manuscript cultures, SFB 950 ‘Manuskriptkulturen in Asien, Afrika und Europa’, 2020, pp.11-24 ; https://www.csmc.uni-hamburg.de/publications/mc/files/articles/mc15-02-stutzmann.pdf (2020)
BASE
Show details
56
A comparative study of speech anonymization metrics
In: INTERSPEECH 2020 ; https://hal.inria.fr/hal-02907918 ; INTERSPEECH 2020, Oct 2020, Shanghai, China (2020)
BASE
Show details
57
Annotating Multimodal data of Singing and Speaking
In: The Routledge Companion to Interdisciplinary Studies in Singing ; https://hal.archives-ouvertes.fr/hal-02869809 ; Frank A. Russo; Beatriz Ilari; Annabel J. Cohen. The Routledge Companion to Interdisciplinary Studies in Singing, I, Routledge, 2020, Development, 9781315163734 ; https://www.taylorfrancis.com/books/e/9781315163734/chapters/10.4324/9781315163734-11 (2020)
BASE
Show details
58
CHiME-6 Challenge: Tackling multispeaker speech recognition for unsegmented recordings
In: CHiME 2020 - 6th International Workshop on Speech Processing in Everyday Environments ; https://hal.inria.fr/hal-02546993 ; CHiME 2020 - 6th International Workshop on Speech Processing in Everyday Environments, May 2020, Barcelona / Virtual, Spain (2020)
BASE
Show details
59
Duration modelling and evaluation for Arabic statistical parametric speech synthesis
In: ISSN: 1380-7501 ; EISSN: 1573-7721 ; Multimedia Tools and Applications ; https://hal.inria.fr/hal-03007287 ; Multimedia Tools and Applications, Springer Verlag, 2020, ⟨10.1007/s11042-020-09901-7⟩ (2020)
BASE
Show details
60
A Data-Efficient End-to-End Spoken Language Understanding Architecture
In: International Conference on Acoustics, Speech, and Signal Processing (ICASSP) ; https://hal.archives-ouvertes.fr/hal-03094850 ; International Conference on Acoustics, Speech, and Signal Processing (ICASSP), May 2020, Barcellone, Spain (2020)
BASE
Show details

Page: 1 2 3 4 5 6 7...22

Catalogues
0
0
0
0
0
0
0
Bibliographies
0
0
0
0
0
0
0
0
0
Linked Open Data catalogues
0
Online resources
0
0
0
0
Open access documents
431
0
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern