DE eng

Search in the Catalogues and Directories

Page: 1 2
Hits 1 – 20 of 28

1
Hate speech and offensive language detection using transfer learning approaches ; Détection du discours de haine et du langage offensant utilisant des approches de Transfer Learning
Mozafari, Marzieh. - : HAL CCSD, 2021
In: https://tel.archives-ouvertes.fr/tel-03276023 ; Document and Text Processing. Institut Polytechnique de Paris, 2021. English. ⟨NNT : 2021IPPAS007⟩ (2021)
BASE
Show details
2
Visual question answering with modules and language modeling
Pahuja, Vardaan. - 2019
BASE
Show details
3
Learning and time : on using memory and curricula for language understanding
BASE
Show details
4
Contributions to the study of automatic speech recognitionon Fongbe ; Contributions à l'étude et à la reconnaissance automatique de la parole en Fongbe
Laleye, Frejus Adissa Akintola. - : HAL CCSD, 2016
In: https://tel.archives-ouvertes.fr/tel-01628455 ; Modélisation et simulation. Université du Littoral Côte d'Opale; Université d'Abomey-Calavi (Bénin), 2016. Français. ⟨NNT : 2016DUNK0452⟩ (2016)
BASE
Show details
5
La subjectivité artificielle. Ébauche d'un programme de recherche
In: https://hal.archives-ouvertes.fr/hal-01137849 ; 2016 (2016)
BASE
Show details
6
Acquiring sounds and meaning jointly in early word learning ; L’apprentissage simultané du son et du sens dans l’acquisition première de la language
Fourtassi, Abdellah. - : HAL CCSD, 2015
In: https://tel.archives-ouvertes.fr/tel-01774596 ; Linguistics. Ecole normale supérieure - ENS PARIS, 2015. English. ⟨NNT : 2015ENSU0049⟩ (2015)
BASE
Show details
7
Représentation du langage et modèles d'évolution linguistique : la grammaticalisation comme perspective
In: ISSN: 1248-9433 ; EISSN: 1965-0906 ; Revue TAL ; https://halshs.archives-ouvertes.fr/halshs-01241353 ; Revue TAL, ATALA (Association pour le Traitement Automatique des Langues), 2015, 55 (3), pp.47-71 (2015)
BASE
Show details
8
Empirical methods and statistical modeling of speech ; Approches empiriques et modélisation statistique de la parole
Gilles, Adda. - : HAL CCSD, 2011
In: https://tel.archives-ouvertes.fr/tel-00667961 ; Interface homme-machine [cs.HC]. Université Paris Sud - Paris XI, 2011 (2011)
BASE
Show details
9
Toward a multi-level statistical language modeling for under-resourced language ; Vers une modélisation statistique multi-niveau du langage, application aux langues peu dotées
Seng, Sopheap. - : HAL CCSD, 2010
In: https://tel.archives-ouvertes.fr/tel-00646236 ; Informatique et langage [cs.CL]. Université de Grenoble, 2010. Français (2010)
BASE
Show details
10
Accents régionaux en français : perception, analyse et modélisation à partir de grands corpus
Woehrling, Cécile. - : HAL CCSD, 2009
In: https://tel.archives-ouvertes.fr/tel-00617248 ; Informatique [cs]. Université Paris Sud - Paris XI, 2009. Français (2009)
BASE
Show details
11
Économie symbolique et phylogenèse du langage
In: ISSN: 0439-4216 ; EISSN: 1953-8103 ; L'Homme - Revue française d'anthropologie ; https://halshs.archives-ouvertes.fr/halshs-00325054 ; L'Homme - Revue française d'anthropologie, Éditions de l'EHESS 2009, 192, pp.67-100 (2009)
BASE
Show details
12
Synergie des approches et des ressources déployées pour le traitement de l'écrit
Morin, Emmanuel. - : HAL CCSD, 2007
In: https://tel.archives-ouvertes.fr/tel-00482893 ; Sciences de l'ingénieur [physics]. Université de Nantes, 2007 (2007)
BASE
Show details
13
Integration of linguistic knowledge for the recognition of on-line handwritten texts ; Intégration de connaissances linguistiques pour la reconnaissance de textes manuscrits en-ligne
Quiniou, Solen. - : HAL CCSD, 2007
In: https://tel.archives-ouvertes.fr/tel-00580623 ; Interface homme-machine [cs.HC]. INSA de Rennes, 2007. Français (2007)
BASE
Show details
14
Automatic Speech Recognition for Under-Ressourced Languages ; Reconnaissance automatique de la parole pour des langues peu dotées
Le, Viet Bac. - : HAL CCSD, 2006
In: https://tel.archives-ouvertes.fr/tel-00081061 ; Interface homme-machine [cs.HC]. Université Joseph-Fourier - Grenoble I, 2006. Français (2006)
Abstract: Nowadays, computers are heavily used to communicate via text and speech. Text processing tools, electronic dictionaries, and even more advanced systems like text-to-speech or dictation are readily available for several languages. There are however more than 6900 languages in the world and only a small number possess the resources required for implementation of Human Language Technologies (HLT). Thus, HLT are mostly concerned by languages for which large resources are available or which have suddenly become of interest because of the economic or political scene. On the contrary, languages from developing countries or minorities have been less worked on in the past years. One way of improving this "language divide" is do more research on portability of HLT for multilingual applications. Among HLT, we are particularly interested in Automatic Speech Recognition (ASR). Therefore, we are interested in new techniques and tools for rapid development of ASR systems for under-resourced languages or π-languages when only limited resources are available. These languages are typically spoken in developing countries, but can nevertheless have many speakers. In this work, we investigate Vietnamese and Khmer, which are respectively spoken by 67 million and 13 million people, but for which speech processing services do not exist at all. Firstly, given the statistical nature of the methods used in ASR, a large amount of resources (vocabularies, text corpora, transcribed speech corpora, phonetic dictionaries) is crucial for building an ASR system for a new language. Concerning text resources, a new methodology for fast text corpora acquisition for π-languages is proposed and applied to Vietnamese and Khmer. Some specific problems in text acquisition and text processing for π-languages such as text normalization, text segmentation, text filtering are resolved. For fast developing of text processing tools for a new π-language, an open source generic toolkit named CLIPS-Text-Tk was developed during this thesis. Secondly, for acoustic modeling, we address particularly the use of acoustic-phonetic unit similarities for multilingual acoustic models portability to new languages. Notably, an estimation method of the similarity between two phonemes is first proposed. Based on these phoneme similarities, some estimation methods for polyphone similarity and clustered polyphonic model similarity are investigated. For a new language, a source/target acoustic-phonetic unit mapping table can be constructed with these similarity measures. Then, clustered models in the target language are duplicated from the nearest clustered models in the source language and adapted with limited data to the target language. Results obtained for Vietnamese demonstrate the feasibility and efficiency of these methods. The proposal of grapheme-based acoustic modeling, which avoids building a pronunciation dictionary, is also investigated in our work. Finally, our whole methodology is applied to design a Khmer ASR system which leads to 70% word accuracy and which was developed in only five months. ; Dans la plupart des langues peu dotées, les services liés aux technologies du traitement de l'oral sont inexistants. L'originalité de mon travail de thèse vient de la volonté d'aborder ces langues pour lesquelles peu ou pas de ressources nécessaires pour la reconnaissance automatique de la parole sont disponibles. Ce manuscrit présente notre méthodologie qui vise à développer et adapter rapidement un système de reconnaissance automatique de la parole continue pour une nouvelle langue peu dotée. La nature statistique des approches nécessite de disposer d'une grande quantité de ressources (vocabulaires, grands corpus de texte, grands corpus de parole, dictionnaires de prononciation) pour le développement d'un système de reconnaissance automatique de la parole continue à grand vocabulaire. Ces ressources ne sont cependant pas disponibles directement pour des langues peu dotées. Par conséquent, une première façon d'accélérer la portabilité des systèmes de reconnaissance vocale vers une nouvelle langue est de développer une méthodologie permettant une collecte rapide et facilitée de ressources écrites et orales. Dans ce travail, nous proposons tout d'abord des solutions pour résoudre les difficultés principales de récupération et de traitement des ressources textuelles spécifiques aux langues peu dotées : recueil d'un vocabulaire, collecte de documents à partir de l'Internet, normalisation de textes, segmentation de textes, filtrage. Une boîte à outils générique « open source » nommée CLIPS-Text-Tk a notamment été développée pour faciliter le portage des outils de traitement de corpus textuels vers une nouvelle langue. Ensuite, la plus grande partie de notre travail de thèse concerne la construction rapide de modèles acoustiques pour une langue peu dotée. Nous proposons des concepts et des méthodes d'estimation de similarités entre unités phonémiques (phonème, polyphone, groupe de polyphones, .). Ces mesures de similarité sont ensuite utilisées pour la portabilité et l'adaptation rapide des modèles acoustiques multilingues indépendant et dépendant du contexte vers une nouvelle langue peu dotée. Pour les langues peu dotées qui ne disposent pas encore de dictionnaire phonétique, une modélisation acoustique à base de graphèmes est aussi proposée et évaluée. Enfin, les ressources écrites et orales collectées pour le vietnamien et le khmer ainsi que les résultats expérimentaux obtenus par nos systèmes de reconnaissance automatique de la parole en vietnamien et en khmer sont présentés et valident le potentiel des méthodes que nous avons proposées.
Keyword: [INFO.INFO-HC]Computer Science [cs]/Human-Computer Interaction [cs.HC]; acoustic-phonetic unit similarities; adaptation de modèles acoustiques; crosslingual acoustic modeling and adaptation; grapheme-based ASR; langues peu dotées; LVCSR; modélisation acoustique crosslingue; modélisation acoustique graphémique; modélisation statistique du langage; reconnaissance automatique de la parole; ressources écrites et orales; similarités entre des unités acoustique-phonémiques; speech and language resources acquisition; statistical language modeling; under-resourced languages
URL: https://tel.archives-ouvertes.fr/tel-00081061/document
https://tel.archives-ouvertes.fr/tel-00081061
https://tel.archives-ouvertes.fr/tel-00081061/file/These-LeVietBac-0609.pdf
BASE
Hide details
15
Une grammaire multilingue partagée pour la traduction automatique de la parole
In: Proceedings of Traitement Automatique des Langues Naturelles (TALN) (2006) (2006)
BASE
Show details
16
Bottom-up methods for Knowledge Engineering ; Méthodes ascendantes pour l'ingénierie des connaissances
Aussenac-Gilles, Nathalie. - : HAL CCSD, 2005
In: https://tel.archives-ouvertes.fr/tel-00089165 ; Informatique. Université Paul Sabatier - Toulouse III, 2005 (2005)
BASE
Show details
17
ABISPA: Apprentissage Bayésien Intersensoriel de Structures Phonologiques par un Androïde bébé
In: https://hal.archives-ouvertes.fr/hal-00003661 ; 2005 (2005)
BASE
Show details
18
Trois modèles informatiques pour l'émergence du langage
In: Aux origines des langues et du langage ; https://halshs.archives-ouvertes.fr/halshs-00009730 ; Jean-Marie Hombert. Aux origines des langues et du langage, Fayard, pp.232-235, 2005 (2005)
BASE
Show details
19
Une nouvelle approche de modélisation du langage par des réseaux Bayésiens dynamiques
In: XXVes Journées d'Etudes sur la Parole - JEP-TALN-RECITAL 2004 ; https://hal.inria.fr/inria-00107785 ; XXVes Journées d'Etudes sur la Parole - JEP-TALN-RECITAL 2004, 2004, Fès, Maroc (2004)
BASE
Show details
20
Language modeling using dynamic Bayesian networks
In: 4th International Conference on Language Resources and Evaluation - LREC 2004 ; https://hal.inria.fr/inria-00107786 ; 4th International Conference on Language Resources and Evaluation - LREC 2004, 2004, Lisbonne, Portugal (2004)
BASE
Show details

Page: 1 2

Catalogues
0
0
0
0
0
0
0
Bibliographies
0
0
0
0
0
0
0
0
0
Linked Open Data catalogues
0
Online resources
0
0
0
0
Open access documents
28
0
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern