Home Catalogue search

eng

Refine your search:

Search in the Catalogues and Directories






	Sort by
Simple Search

Page: 1 2

Hits 1 – 20 of 28

1	Hate speech and offensive language detection using transfer learning approaches ; Détection du discours de haine et du langage offensant utilisant des approches de Transfer Learning
	Mozafari, Marzieh. - : HAL CCSD, 2021
	In: https://tel.archives-ouvertes.fr/tel-03276023 ; Document and Text Processing. Institut Polytechnique de Paris, 2021. English. ⟨NNT : 2021IPPAS007⟩ (2021)
	BASE
	Show details

2	Visual question answering with modules and language modeling
	Pahuja, Vardaan. - 2019
	BASE
	Show details

3	Learning and time : on using memory and curricula for language understanding
	Gulcehre, Caglar. - 2018
	BASE
	Show details

4	Contributions to the study of automatic speech recognitionon Fongbe ; Contributions à l'étude et à la reconnaissance automatique de la parole en Fongbe
	Laleye, Frejus Adissa Akintola. - : HAL CCSD, 2016
	In: https://tel.archives-ouvertes.fr/tel-01628455 ; Modélisation et simulation. Université du Littoral Côte d'Opale; Université d'Abomey-Calavi (Bénin), 2016. Français. ⟨NNT : 2016DUNK0452⟩ (2016)
	BASE
	Show details

5	La subjectivité artificielle. Ébauche d'un programme de recherche
	Pinto, Jean-Jacques
	In: https://hal.archives-ouvertes.fr/hal-01137849 ; 2016 (2016)
	BASE
	Show details

6	Acquiring sounds and meaning jointly in early word learning ; L’apprentissage simultané du son et du sens dans l’acquisition première de la language
	Fourtassi, Abdellah. - : HAL CCSD, 2015
	In: https://tel.archives-ouvertes.fr/tel-01774596 ; Linguistics. Ecole normale supérieure - ENS PARIS, 2015. English. ⟨NNT : 2015ENSU0049⟩ (2015)
	BASE
	Show details

7	Représentation du langage et modèles d'évolution linguistique : la grammaticalisation comme perspective
	Feltgen, Quentin; Fagard, Benjamin; Nadal, Jean-Pierre
	In: ISSN: 1248-9433 ; EISSN: 1965-0906 ; Revue TAL ; https://halshs.archives-ouvertes.fr/halshs-01241353 ; Revue TAL, ATALA (Association pour le Traitement Automatique des Langues), 2015, 55 (3), pp.47-71 (2015)
	BASE
	Show details

8	Empirical methods and statistical modeling of speech ; Approches empiriques et modélisation statistique de la parole
	Gilles, Adda. - : HAL CCSD, 2011
	In: https://tel.archives-ouvertes.fr/tel-00667961 ; Interface homme-machine [cs.HC]. Université Paris Sud - Paris XI, 2011 (2011)
	BASE
	Show details

9	Toward a multi-level statistical language modeling for under-resourced language ; Vers une modélisation statistique multi-niveau du langage, application aux langues peu dotées
	Seng, Sopheap. - : HAL CCSD, 2010
	In: https://tel.archives-ouvertes.fr/tel-00646236 ; Informatique et langage [cs.CL]. Université de Grenoble, 2010. Français (2010)
	BASE
	Show details

10	Accents régionaux en français : perception, analyse et modélisation à partir de grands corpus
	Woehrling, Cécile. - : HAL CCSD, 2009
	In: https://tel.archives-ouvertes.fr/tel-00617248 ; Informatique [cs]. Université Paris Sud - Paris XI, 2009. Français (2009)
	BASE
	Show details

11	Économie symbolique et phylogenèse du langage
	Lassègue, Jean; Rosenthal, Victor; Visetti, Yves-Marie
	In: ISSN: 0439-4216 ; EISSN: 1953-8103 ; L'Homme - Revue française d'anthropologie ; https://halshs.archives-ouvertes.fr/halshs-00325054 ; L'Homme - Revue française d'anthropologie, Éditions de l'EHESS 2009, 192, pp.67-100 (2009)
	BASE
	Show details

12	Synergie des approches et des ressources déployées pour le traitement de l'écrit
	Morin, Emmanuel. - : HAL CCSD, 2007
	In: https://tel.archives-ouvertes.fr/tel-00482893 ; Sciences de l'ingénieur [physics]. Université de Nantes, 2007 (2007)
	BASE
	Show details

13	Integration of linguistic knowledge for the recognition of on-line handwritten texts ; Intégration de connaissances linguistiques pour la reconnaissance de textes manuscrits en-ligne
	Quiniou, Solen. - : HAL CCSD, 2007
	In: https://tel.archives-ouvertes.fr/tel-00580623 ; Interface homme-machine [cs.HC]. INSA de Rennes, 2007. Français (2007)
	BASE
	Show details

14	Automatic Speech Recognition for Under-Ressourced Languages ; Reconnaissance automatique de la parole pour des langues peu dotées
	Le, Viet Bac. - : HAL CCSD, 2006
	In: https://tel.archives-ouvertes.fr/tel-00081061 ; Interface homme-machine [cs.HC]. Université Joseph-Fourier - Grenoble I, 2006. Français (2006)
	Abstract: Nowadays, computers are heavily used to communicate via text and speech. Text processing tools, electronic dictionaries, and even more advanced systems like text-to-speech or dictation are readily available for several languages. There are however more than 6900 languages in the world and only a small number possess the resources required for implementation of Human Language Technologies (HLT). Thus, HLT are mostly concerned by languages for which large resources are available or which have suddenly become of interest because of the economic or political scene. On the contrary, languages from developing countries or minorities have been less worked on in the past years. One way of improving this "language divide" is do more research on portability of HLT for multilingual applications. Among HLT, we are particularly interested in Automatic Speech Recognition (ASR). Therefore, we are interested in new techniques and tools for rapid development of ASR systems for under-resourced languages or π-languages when only limited resources are available. These languages are typically spoken in developing countries, but can nevertheless have many speakers. In this work, we investigate Vietnamese and Khmer, which are respectively spoken by 67 million and 13 million people, but for which speech processing services do not exist at all. Firstly, given the statistical nature of the methods used in ASR, a large amount of resources (vocabularies, text corpora, transcribed speech corpora, phonetic dictionaries) is crucial for building an ASR system for a new language. Concerning text resources, a new methodology for fast text corpora acquisition for π-languages is proposed and applied to Vietnamese and Khmer. Some specific problems in text acquisition and text processing for π-languages such as text normalization, text segmentation, text filtering are resolved. For fast developing of text processing tools for a new π-language, an open source generic toolkit named CLIPS-Text-Tk was developed during this thesis. Secondly, for acoustic modeling, we address particularly the use of acoustic-phonetic unit similarities for multilingual acoustic models portability to new languages. Notably, an estimation method of the similarity between two phonemes is first proposed. Based on these phoneme similarities, some estimation methods for polyphone similarity and clustered polyphonic model similarity are investigated. For a new language, a source/target acoustic-phonetic unit mapping table can be constructed with these similarity measures. Then, clustered models in the target language are duplicated from the nearest clustered models in the source language and adapted with limited data to the target language. Results obtained for Vietnamese demonstrate the feasibility and efficiency of these methods. The proposal of grapheme-based acoustic modeling, which avoids building a pronunciation dictionary, is also investigated in our work. Finally, our whole methodology is applied to design a Khmer ASR system which leads to 70% word accuracy and which was developed in only five months. ; Dans la plupart des langues peu dotées, les services liés aux technologies du traitement de l'oral sont inexistants. L'originalité de mon travail de thèse vient de la volonté d'aborder ces langues pour lesquelles peu ou pas de ressources nécessaires pour la reconnaissance automatique de la parole sont disponibles. Ce manuscrit présente notre méthodologie qui vise à développer et adapter rapidement un système de reconnaissance automatique de la parole continue pour une nouvelle langue peu dotée. La nature statistique des approches nécessite de disposer d'une grande quantité de ressources (vocabulaires, grands corpus de texte, grands corpus de parole, dictionnaires de prononciation) pour le développement d'un système de reconnaissance automatique de la parole continue à grand vocabulaire. Ces ressources ne sont cependant pas disponibles directement pour des langues peu dotées. Par conséquent, une première façon d'accélérer la portabilité des systèmes de reconnaissance vocale vers une nouvelle langue est de développer une méthodologie permettant une collecte rapide et facilitée de ressources écrites et orales. Dans ce travail, nous proposons tout d'abord des solutions pour résoudre les difficultés principales de récupération et de traitement des ressources textuelles spécifiques aux langues peu dotées : recueil d'un vocabulaire, collecte de documents à partir de l'Internet, normalisation de textes, segmentation de textes, filtrage. Une boîte à outils générique « open source » nommée CLIPS-Text-Tk a notamment été développée pour faciliter le portage des outils de traitement de corpus textuels vers une nouvelle langue. Ensuite, la plus grande partie de notre travail de thèse concerne la construction rapide de modèles acoustiques pour une langue peu dotée. Nous proposons des concepts et des méthodes d'estimation de similarités entre unités phonémiques (phonème, polyphone, groupe de polyphones, .). Ces mesures de similarité sont ensuite utilisées pour la portabilité et l'adaptation rapide des modèles acoustiques multilingues indépendant et dépendant du contexte vers une nouvelle langue peu dotée. Pour les langues peu dotées qui ne disposent pas encore de dictionnaire phonétique, une modélisation acoustique à base de graphèmes est aussi proposée et évaluée. Enfin, les ressources écrites et orales collectées pour le vietnamien et le khmer ainsi que les résultats expérimentaux obtenus par nos systèmes de reconnaissance automatique de la parole en vietnamien et en khmer sont présentés et valident le potentiel des méthodes que nous avons proposées.
	Keyword: [INFO.INFO-HC]Computer Science [cs]/Human-Computer Interaction [cs.HC]; acoustic-phonetic unit similarities; adaptation de modèles acoustiques; crosslingual acoustic modeling and adaptation; grapheme-based ASR; langues peu dotées; LVCSR; modélisation acoustique crosslingue; modélisation acoustique graphémique; modélisation statistique du langage; reconnaissance automatique de la parole; ressources écrites et orales; similarités entre des unités acoustique-phonémiques; speech and language resources acquisition; statistical language modeling; under-resourced languages
	URL: https://tel.archives-ouvertes.fr/tel-00081061/document https://tel.archives-ouvertes.fr/tel-00081061 https://tel.archives-ouvertes.fr/tel-00081061/file/These-LeVietBac-0609.pdf
	BASE
	Hide details

15	Une grammaire multilingue partagée pour la traduction automatique de la parole
	Rayner, Emmanuel; Starlander, Marianne; Chatzichrisafis, Nikolaos...
	In: Proceedings of Traitement Automatique des Langues Naturelles (TALN) (2006) (2006)
	BASE
	Show details

16	Bottom-up methods for Knowledge Engineering ; Méthodes ascendantes pour l'ingénierie des connaissances
	Aussenac-Gilles, Nathalie. - : HAL CCSD, 2005
	In: https://tel.archives-ouvertes.fr/tel-00089165 ; Informatique. Université Paul Sabatier - Toulouse III, 2005 (2005)
	BASE
	Show details

17	ABISPA: Apprentissage Bayésien Intersensoriel de Structures Phonologiques par un Androïde bébé
	Boë, Louis-Jean; Schwartz, Jean-Luc
	In: https://hal.archives-ouvertes.fr/hal-00003661 ; 2005 (2005)
	BASE
	Show details

18	Trois modèles informatiques pour l'émergence du langage
	Victorri, Bernard
	In: Aux origines des langues et du langage ; https://halshs.archives-ouvertes.fr/halshs-00009730 ; Jean-Marie Hombert. Aux origines des langues et du langage, Fayard, pp.232-235, 2005 (2005)
	BASE
	Show details

19	Une nouvelle approche de modélisation du langage par des réseaux Bayésiens dynamiques
	Deviren, Murat; Daoudi, Khalid; Smaïli, Kamel
	In: XXVes Journées d'Etudes sur la Parole - JEP-TALN-RECITAL 2004 ; https://hal.inria.fr/inria-00107785 ; XXVes Journées d'Etudes sur la Parole - JEP-TALN-RECITAL 2004, 2004, Fès, Maroc (2004)
	BASE
	Show details

20	Language modeling using dynamic Bayesian networks
	Deviren, Murat; Daoudi, Khalid; Smaïli, Kamel
	In: 4th International Conference on Language Resources and Evaluation - LREC 2004 ; https://hal.inria.fr/inria-00107786 ; 4th International Conference on Language Resources and Evaluation - LREC 2004, 2004, Lisbonne, Portugal (2004)
	BASE
	Show details

Page: 1 2

© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern