DE eng

Search in the Catalogues and Directories

Hits 1 – 9 of 9

1
Machine Translation of Arabic Dialects
BASE
Show details
2
Automatic Identification of Maghreb Dialects Using a Dictionary-Based Approach
In: Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018) ; Eleventh International Conference on Language Resources and Evaluation (LREC 2018) ; https://hal.archives-ouvertes.fr/hal-02012150 ; Eleventh International Conference on Language Resources and Evaluation (LREC 2018), May 2018, Miyazaki, Japan (2018)
BASE
Show details
3
Statistical Machine Translation: Application to low resourced languages ; Traduction Automatique Fondée sur des Méthodes Statistiques : Application aux Langues peu Dotées en Ressources
Harrat, Salima. - : HAL CCSD, 2018
In: https://hal.inria.fr/tel-03186940 ; Computation and Language [cs.CL]. École Supérieure d’Informatique, 2018. English (2018)
Abstract: This work is dedicated to statistical machine translation for poorly resourced languages. We are interested in Arabic dialects which represent the daily language of all Arab peoples. These dialects differ from one Arab country to another and even in the same country several variations of dialects coexist. These dialects by their oral nature and non-standard represent a challenge in NLP. In machine translation, these dialects are difficult to translate because of the lack of resources (of all natures) in particular the monolingual and especially parallel corpora necessary for training. In this thesis, we are interested by this issue with particular attention to the Algerian dialect and more precisely to the Algiers dialect. A parallel multi-dialect PADIC corpus (for Parallel Arabic Dialect Corpus) has been created, this is a textual resource important which includes, so far, six Arabic dialects in addition to Modern Standard Arabic. This corpus was the subject of an analytical study to highlight the relationship between dialects (between them) and Standard Arabic. By means of the corpus PADIC, we tackled the problem of statistical machine translation between the different dialect pairs and Standard Arabic. Several results have been obtained and all point to the difficulty of translating dialects. In addition, several tools dedicated to the Algiers dialect have been produced in the framework of this thesis. The problem of code-switching was also discussed where an identification tool was implemented using techniques of "Machine Learning". ; Le présent travail s’articule autour de la traduction automatique statistique dans le cadre des langues peu dotées en ressources. On s’intéresse aux dialectes arabes qui représentent le parlé quotidien de tous les peuples arabes. Ces dialectes différent d’un pays arabe à un autre et même dans un même pays on constate l’existence de plusieurs variantes de dialectes. Ces dialectes de par leur nature orale et non-standard représentent un défi pour le domaine de traitement automatique des langues. Dans le cadre précis de la traduction automatique statistique, ces dialectes sont difficiles à prendre en charge à cause de l’absence de ressources (de toutes natures) notamment les corpus monolingues et surtout parallèles nécessaires pour l’apprentissage des différents modèles statistiques. Dans cette thèse, on s’intéresse à cette problématique avec une attention particulière au dialecte algérien et plus précisément le dialecte algérois. Un corpus parallèle multi-dialecte PADIC (pour Parallel Arabic Dialect Corpus) a été créé, il s’agit d’une ressource textuelle importante qui comprend, jusqu’à présent, six dialectes arabes en plus de l’arabe standard. Ce corpus a fait l’objet d’une étude analytique pour mettre en relief la relation entre les dialectes (entre eux) et l’arabe standard. Au moyen du corpus PADIC, on s’est attaqué au problème de la traduction automatique statistique entre les différentes paires de dialectes et l’arabe standard. Plusieurs résultats ont été obtenus et vont tous dans le sens de la difficulté de la traduction des dialectes. Par ailleurs, plusieurs outils dédiés au dialecte algérois ont été réalisés dans le cadre de cette thèse. Le problème du code-switching a été aussi abordé au cours de ce travail où un outil d’identification a été mis en œuvre grâce aux techniques du « Machine Learning ».
Keyword: [INFO.INFO-CL]Computer Science [cs]/Computation and Language [cs.CL]; Algerian dialect' resources; Code-Switching; Machine translation for Arabic dialects; Modèles statistiques de traduction; PADIC; Ressources pour le dialecte algérien; Statistical Machine Translation; Traduction de dialectes arabes
URL: https://hal.inria.fr/tel-03186940
https://hal.inria.fr/tel-03186940/document
https://hal.inria.fr/tel-03186940/file/these-Salima-Harrat.pdf
BASE
Hide details
4
La communication entre Libanais et Jordaniens sur les réseaux numériques ; Communication Practices Between Lebanese and Jordanians on Digital Networks
In: Hermès [ISSN 0767-9513], Nouvelles voix de la recherche en communication, 2018, 82, p. 216 (2018)
BASE
Show details
5
A Multitask-Based Neural Machine Translation Model with Part-of-Speech Tags Integration for Arabic Dialects
In: Applied Sciences ; Volume 8 ; Issue 12 (2018)
BASE
Show details
6
Machine Translation of Arabic Dialects ...
Salloum, Wael Sameer. - : Columbia University, 2018
BASE
Show details
7
Multi-dialect Arabic broadcast speech recognition
Ali, Ahmed Mohamed Abdel Maksoud. - : The University of Edinburgh, 2018
BASE
Show details
8
Dataset construction for the detection of anti-social behaviour in online communication in arabic
BASE
Show details
9
Algunos proverbios de actual uso en Damasco ; Some proverbs in current use in Damascus
In: Dialectologia: revista electrònica; 2018: Núm. 20; p. 43-60 (2018)
BASE
Show details

Catalogues
Bibliographies
Linked Open Data catalogues
Online resources
Open access documents
9
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern