1 |
Détection des couples de termes translittérés à partir d'un corpus parallèle anglais-arabe
|
|
|
|
In: Conférence sur le Traitement Automatique des Langues Naturelles ; https://hal.archives-ouvertes.fr/hal-01899828 ; Conférence sur le Traitement Automatique des Langues Naturelles, May 2018, Rennes, France (2018)
|
|
Abstract:
Nous présentons une méthode pour extraire des couples de termes médicaux translittérés de l'anglais en caractères arabes. Nous avons proposé un processus de construction des translittérations de termes anglais en arabe. Celui-ci s'appuie sur une étude en corpus pour la création d'une table de correspondances des caractères anglais en arabe mais aussi sur des règles de conversion qui tiennent compte de certaines particularités de la langue arabe comme l'agglutination et la non-voyellation. Nous avons évalué l'apport de l'utilisation de la translittération pour identifier des couples de termes anglais-arabe sur un corpus parallèle de textes médicaux. Les résultats montrent que parmi 137 couples de mots anglais-arabe extraits, 120 sont jugés corrects (soit 87,59%), dont 107 représentent des couples de termes médicaux (soit 89,16% des translittérations correctes et 78,10% des résultats).
|
|
Keyword:
[INFO.INFO-CL]Computer Science [cs]/Computation and Language [cs.CL]; [INFO]Computer Science [cs]; alignement de mots; corpus parallèle; Extraction terminologique bilingue; translittération
|
|
URL: https://hal.archives-ouvertes.fr/hal-01899828
|
|
BASE
|
|
Hide details
|
|
2 |
Clinical Natural Language Processing in languages other than English: opportunities and challenges.
|
|
|
|
In: ISSN: 2041-1480 ; Journal of Biomedical Semantics ; https://hal.archives-ouvertes.fr/hal-01842518 ; Journal of Biomedical Semantics, BioMed Central, 2018, 9, 13p. ⟨10.1186/s13326-018-0179-8⟩ (2018)
|
|
BASE
|
|
Show details
|
|
3 |
CLEF eHealth 2018 Multilingual Information Extraction Task Overview: ICD10 Coding of Death Certificates in French, Hungarian and Italian
|
|
|
|
In: Conference and Labs of the Evaluation Forum, eHealth ; https://hal.archives-ouvertes.fr/hal-02276492 ; Conference and Labs of the Evaluation Forum, eHealth, CEUR, Sep 2018, Avignon, France (2018)
|
|
BASE
|
|
Show details
|
|
4 |
A Multilingual Dataset for Evaluating Parallel Sentence Extraction from Comparable Corpora
|
|
|
|
In: International Conference on Language Resources and Evaluation ; https://hal.archives-ouvertes.fr/hal-01898362 ; International Conference on Language Resources and Evaluation, May 2018, Miyazaki, Japan (2018)
|
|
BASE
|
|
Show details
|
|
5 |
GNEG: Graph-Based Negative Sampling for word2vec
|
|
|
|
In: Annual Meeting of the Association for Computational Linguistics ; https://hal.archives-ouvertes.fr/hal-01899825 ; Annual Meeting of the Association for Computational Linguistics, Jul 2018, Melbourne, Australia (2018)
|
|
BASE
|
|
Show details
|
|
6 |
Expanding the Diversity of Texts and Applications: Findings from the Section on Clinical Natural Language Processing of the International Medical Informatics Association Yearbook.
|
|
|
|
In: ISSN: 0943-4747 ; EISSN: 2364-0502 ; IMIA Yearbook of Medical Informatics ; https://hal.archives-ouvertes.fr/hal-01990501 ; IMIA Yearbook of Medical Informatics, Schattauer, 2018, 27, pp.193-198 (2018)
|
|
BASE
|
|
Show details
|
|
7 |
Clinical Natural Language Processing in languages other than English: opportunities and challenges
|
|
|
|
BASE
|
|
Show details
|
|
8 |
Expanding the Diversity of Texts and Applications: Findings from the Section on Clinical Natural Language Processing of the International Medical Informatics Association Yearbook
|
|
|
|
BASE
|
|
Show details
|
|
9 |
Three Dimensions of Reproducibility in Natural Language Processing
|
|
|
|
BASE
|
|
Show details
|
|
|
|