DE eng

Search in the Catalogues and Directories

Page: 1 2 3
Hits 1 – 20 of 56

1
JABER and SABER: Junior and Senior Arabic BERt ...
BASE
Show details
2
End-to-End Self-Debiasing Framework for Robust NLU Training ...
BASE
Show details
3
Context-aware Adversarial Training for Name Regularity Bias in Named Entity Recognition ...
BASE
Show details
4
Alzheimer prediction from connected speech extracts : assessment of generalisation to new data
BASE
Show details
5
Connected speech markers of amyloid burden in primary progressive aphasia
BASE
Show details
6
Prediction of Alzheimer's disease and semantic dementia from scene description: toward better language and topic generalization
Ivensky, Ilya. - 2020
BASE
Show details
7
Open source quality control tool for translation memory using artificial intelligence
BASE
Show details
8
Comparaison de systèmes de traduction automatique pour la post édition des alertes météorologique d'Environnement Canada
BASE
Show details
9
Extracting Parallel Sentences with Bidirectional Recurrent Neural Networks to Improve Machine Translation ...
BASE
Show details
10
Robust Lexical Features for Improved Neural Network Named-Entity Recognition ...
BASE
Show details
11
A Deep Neural Network Approach To Parallel Sentence Extraction ...
BASE
Show details
12
Extraction de phrases parallèles à partir d’un corpus comparable avec des réseaux de neurones récurrents bidirectionnels
BASE
Show details
13
Induction de lexiques bilingues à partir de corpus comparables et parallèles
Abstract: Les modèles statistiques tentent de généraliser la connaissance à partir de la fréquence des événements probabilistes présents dans les données. Si plus de données sont disponibles, les événements sont plus souvent observés et les modèles sont plus performants. Les approches du Traitement Automatique de la Langue basées sur ces modèles sont donc dépendantes de la disponibilité et de la quantité des ressources à disposition. Cette dépendance aux données touche en particulier la Traduction Automatique Statistique qui, de surcroît, requiert des ressources de type multilingue. Cette thèse rapporte quatre articles sur deux tâches qui contribuent de près à cette dépendance : l’Alignement de Documents Bilingues (ADB) et l’Induction de Lexiques Bilingues (ILB). La première publication décrit le système soumis à la tâche partagée d’ADB de la conférence WMT16. Développé sur un moteur de recherche, notre système indexe des sites web bilingues et tente d’identifier les pages anglaises-françaises qui sont en relation de traduction. L’alignement est réalisé grâce à la représentation "sac de mots" et un lexique bilingue. L’outil développé nous a permis d’évaluer plus de 1000 configurations et d’en identifier une qui fournit des performances respectables sur la tâche. Les trois autres articles concernent la tâche d’ILB. Le premier revient sur l’approche dite "standard" et propose une exploration en largeur des paramètres dans le contexte du Web Sémantique. Le deuxième article compare l’approche standard avec les plus récentes techniques basées sur les représentations interlingues de mots (embeddings en anglais) issues de réseaux de neurones. La dernière contribution reporte des performances globales améliorées sur la tâche en combinant, par reclassement supervisée, les sorties des deux types d’approches précédemment étudiées. ; Statistical models try to generalize knowledge starting from the frequency of probabilistic events in the data. If more data is available, events are more often observed and models are more e cient. Natural Language Processing approaches based on those models are therefore dependant on the quantity and availability of these resources. Thus, there is a permanent need for generating and updating the learning data. This dependency touches Statistical Machine Translation, which requires multilingual resources. This thesis refers to four articles tackling two tasks that contribute signi - cantly to this dependency: the Bilingual Documents Alignment (BDA) and the Bilingual Lexicons Induction (BLI). The rst publication describes the system submitted for the BDA shared task of the WMT16 conference. Developed on a search engine, our system indexes bilingual web sites and tries to identify the English-French pages linked by translation. The alignment is realized using a "bag of words" representation and a bilingual lexicon. The tool we have developed allowed us to evaluate more than 1,000 con gurations and identify one yielding decent performances on this particular task. The three other articles are concerned with the BLI task. The rst one focuses on the so-called standard approach, and proposes a breadth parameter exploration in the Semantic Web context. The second article compares the standard approach with more recent techniques based on interlingual representation of words, or the so-called embeddings, issued from neural networks. The last contribution reports the enhanced global performances on the task, combining the outputs of the two studied approaches through supervised reclassification.
Keyword: alignement; Alignment; Applied Sciences - Artificial Intelligence / Sciences appliqués et technologie - Intelligence artificielle (UMI : 0800); Bilingual lexicons induction; Comparable corpus; corpus comparable; corpus parallèle; embedding; induction lexique bilingue; Parallel corpus; reclassement supervisé; représentation de mots; Supervised reclassification; Word representation
URL: http://hdl.handle.net/1866/20488
BASE
Hide details
14
Designing a machine translation system for Canadian weather warnings: A case study
In: Natural language engineering. - Cambridge : Cambridge University Press 20 (2014) 3, 399-433
OLC Linguistik
Show details
15
Texto4science : a Quebec French database of annotated text messages
In: SMS communication (Amsterdam, 2014), p. 87-110
MPI für Psycholinguistik
Show details
16
Projection multilingue d'annotations pour dialogues avancés
Julien, Simon. - 2014
BASE
Show details
17
Utilisation de représentations de mots pour l’étiquetage de rôles sémantiques suivant FrameNet
BASE
Show details
18
Traduction statistique vers une langue à morphologie riche : combinaison d’algorithmes de segmentation morphologique et de modèles statistiques de traduction automatique
BASE
Show details
19
Projection multilingue d'annotations pour dialogues avancés
Julien, Simon. - 2013
BASE
Show details
20
L’extraction de phrases en relation de traduction dans Wikipédia
Rebout, Lise. - 2012
BASE
Show details

Page: 1 2 3

Catalogues
2
0
10
0
3
0
0
Bibliographies
10
0
0
0
0
0
0
0
4
Linked Open Data catalogues
0
Online resources
0
0
0
0
Open access documents
32
0
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern