DE eng

Search in the Catalogues and Directories

Page: 1...6 7 8 9 10
Hits 181 – 189 of 189

181
L’extraction de phrases en relation de traduction dans Wikipédia
Rebout, Lise. - 2012
BASE
Show details
182
Continuous space models with neural networks in natural language processing ; Modèles neuronaux pour la modélisation statistique de la langue
Le, Hai Son. - : HAL CCSD, 2012
In: https://tel.archives-ouvertes.fr/tel-00776704 ; Other [cs.OH]. Université Paris Sud - Paris XI, 2012. English. ⟨NNT : 2012PA112407⟩ (2012)
BASE
Show details
183
ANN and Rule Based Method for English to Arabic Machine Translation
In: http://www.ccis2k.org/iajit/PDF/vol.11,no.4/5308.pdf (2012)
BASE
Show details
184
ANN and Rule Based Method for English to Arabic Machine Translation IAJIT First Online Publication
BASE
Show details
185
L’extraction de phrases en relation de traduction dans Wikipédia
Rebout, Lise. - 2012
Abstract: Afin d'enrichir les données de corpus bilingues parallèles, il peut être judicieux de travailler avec des corpus dits comparables. En effet dans ce type de corpus, même si les documents dans la langue cible ne sont pas l'exacte traduction de ceux dans la langue source, on peut y retrouver des mots ou des phrases en relation de traduction. L'encyclopédie libre Wikipédia constitue un corpus comparable multilingue de plusieurs millions de documents. Notre travail consiste à trouver une méthode générale et endogène permettant d'extraire un maximum de phrases parallèles. Nous travaillons avec le couple de langues français-anglais mais notre méthode, qui n'utilise aucune ressource bilingue extérieure, peut s'appliquer à tout autre couple de langues. Elle se décompose en deux étapes. La première consiste à détecter les paires d’articles qui ont le plus de chance de contenir des traductions. Nous utilisons pour cela un réseau de neurones entraîné sur un petit ensemble de données constitué d'articles alignés au niveau des phrases. La deuxième étape effectue la sélection des paires de phrases grâce à un autre réseau de neurones dont les sorties sont alors réinterprétées par un algorithme d'optimisation combinatoire et une heuristique d'extension. L'ajout des quelques 560~000 paires de phrases extraites de Wikipédia au corpus d'entraînement d'un système de traduction automatique statistique de référence permet d'améliorer la qualité des traductions produites. Nous mettons les données alignées et le corpus extrait à la disposition de la communauté scientifique. ; Working with comparable corpora can be useful to enhance bilingual parallel corpora. In fact, in such corpora, even if the documents in the target language are not the exact translation of those in the source language, one can still find translated words or sentences. The free encyclopedia Wikipedia is a multilingual comparable corpus of several millions of documents. Our task is to find a general endogenous method for extracting a maximum of parallel sentences from this source. We are working with the English-French language pair but our method -- which uses no external bilingual resources -- can be applied to any other language pair. It can best be described in two steps. The first one consists of detecting article pairs that are most likely to contain translations. This is achieved through a neural network trained on a small data set composed of sentence aligned articles. The second step is to perform the selection of sentence pairs through another neural network whose outputs are then re-interpreted by a combinatorial optimization algorithm and an extension heuristic. The addition of the 560~000 pairs of sentences extracted from Wikipedia to the training set of a baseline statistical machine translation system improves the quality of the resulting translations. We make both the aligned data and the extracted corpus available to the scientific community.
Keyword: Algorithmes d'optimisation combinatoire; Alignement de phrases; Applied Sciences - Computer Science / Sciences appliqués et technologie - Informatique (UMI : 0984); Classifiers; Classifieurs; Combinatorial optimization algorithms; Comparable corpora; Corpus comparables; Neural networks; Réseaux de neurones; Sentence alignment; Statistical machine translation; Systèmes de traduction statistiques
URL: http://hdl.handle.net/1866/8614
BASE
Hide details
186
Translation Rules and ANN Based Model for English to Urdu Machine Translation
In: http://www.dcc.ufla.br/infocomp/images/artigos/v10.3/art04.pdf (2011)
BASE
Show details
187
A Survey of Current Paradigms in Machine Translation
In: DTIC (1998)
BASE
Show details
188
Continuous Space Translation Models for Phrase-Based Statistical Machine Translation
In: http://aclweb.org/anthology/C/C12/C12-2104.pdf
BASE
Show details
189
SignON: Bridging the gap between sign and spoken languages
Saggion, Horacio; Shterionov, Dimitar; Labaka, Gorka. - : CEUR Workshop Proceedings
BASE
Show details

Page: 1...6 7 8 9 10

Catalogues
0
0
0
0
0
0
0
Bibliographies
0
0
0
0
0
0
0
0
0
Linked Open Data catalogues
0
Online resources
0
0
0
0
Open access documents
189
0
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern