1 |
Automatic Normalisation of Early Modern French
|
|
|
|
In: https://hal.inria.fr/hal-03540226 ; 2022 (2022)
|
|
BASE
|
|
Show details
|
|
2 |
Extraction and normalization of simple and structured entities in medical documents ; Extraction et normalisation d'entités simples et structurées dans les documents médicaux
|
|
|
|
In: https://hal.archives-ouvertes.fr/tel-03624928 ; Document and Text Processing. Sorbonne Université, 2021. English (2021)
|
|
Abstract:
Hospital clinical documents are rich sources of information for various applications such as patient recruitment for clinical research, epidemiological surveillance, medical coding, and decision support tools. However, being primarily written in natural language, these documents are not easily amenable to large-scale computer processing and must first be structured. We aim to extract entities mentioned in these documents, whether simple or structured, i.e., containing several labels or parts, and normalize them with concept bases. We contribute to several natural language processing (NLP) tasks, namely named entity recognition (NER), medical entity normalization, and structured entity extraction. In particular, we investigate training deep learning models in low data settings, for languages other than English and in the clinical domain. We structure our approach in three steps: tag, normalize, and compose. We first propose two methods to tag simple entities, especially when they overlap in texts. We then develop a large-scale multilingual model to normalize them in several languages. Finally, to compose simple entities into structured entities, we propose a new method based on mention cliques and scope relations. We evaluate it to a new annotated dataset of breast imaging reports. ; Les documents cliniques hospitaliers constituent de riches sources d'information pour diverses applications telles que le recrutement de patients pour la recherche clinique, la surveillance épidémiologique, le codage médical et les outils d'aide à la décision. Cependant, étant essentiellement rédigés en langue naturelle, ces documents ne se prêtent pas aisément à des traitements informatiques à grande échelle et doivent d'abord être structurés.Nous visons à extraire les entités mentionnées dans ces documents, qu'elles soient simples ou structurées, c'est-à-dire contenant plusieurs étiquettes ou parties, et à les normaliser selon des bases de concepts. Nous contribuons à plusieurs tâches de traitement du langage naturel (TAL), à savoir la reconnaissance des entités nommées, la normalisation des entités médicales et l'extraction d'entités structurées. Nous nous intéressons notamment à l'entraînement de modèles par apprentissage profond (deep learning) dans des conditions de données limitées, pour des langues autres que l'anglais et dans le domaine clinique. Nous structurons notre approche en trois étapes : surligner, normaliser et composer. Nous proposons d'abord plusieurs méthodes pour surligner des entités simples, notamment lorsqu'elles se chevauchent dans les textes. Nous développons ensuite une approche multilingue à grande échelle pour les normaliser dans plusieurs langues. Enfin, pour composer ces entités simples en entités structurées, nous proposons une nouvelle méthode basée sur les cliques de mentions et les relations de portée. Nous l'évaluons sur un nouveau corpus annoté de comptes rendus cliniques de mammographies.
|
|
Keyword:
[INFO.INFO-AI]Computer Science [cs]/Artificial Intelligence [cs.AI]; [INFO.INFO-TT]Computer Science [cs]/Document and Text Processing; [SDV.IB]Life Sciences [q-bio]/Bioengineering; [SDV.SPEE]Life Sciences [q-bio]/Santé publique et épidémiologie; clinical; clinique; extraction; multilingual; multilingue; nlp; normalisation; normalization; structure; tal
|
|
URL: https://hal.archives-ouvertes.fr/tel-03624928/file/updated_phd_thesis_PW.pdf https://hal.archives-ouvertes.fr/tel-03624928 https://hal.archives-ouvertes.fr/tel-03624928/document
|
|
BASE
|
|
Hide details
|
|
3 |
La ressource FAIRterm : entre pratique pédagogique et professionnalisation en traduction spécialisée ...
|
|
|
|
BASE
|
|
Show details
|
|
4 |
La ressource FAIRterm : entre pratique pédagogique et professionnalisation en traduction spécialisée ...
|
|
|
|
BASE
|
|
Show details
|
|
5 |
Achieving 'coherence' in routine practice: a qualitative case-based study to describe speech and language therapy interventions with implementation in mind
|
|
|
|
BASE
|
|
Show details
|
|
6 |
The elephant in the (class)room: Emergency Remote Teaching in an ecological perspective
|
|
|
|
In: Revista Brasileira de Linguística Aplicada, Vol 21, Iss 4, Pp 1071-1101 (2021) (2021)
|
|
BASE
|
|
Show details
|
|
7 |
Machine Translation for the Normalisation of 17th c. French ; Traduction automatique pour la normalisation du français du XVII e siècle
|
|
|
|
In: TALN 2020 ; https://hal.archives-ouvertes.fr/hal-02596669 ; TALN 2020, ATALA, Jun 2020, Nancy, France (2020)
|
|
BASE
|
|
Show details
|
|
8 |
CORPUS17: a philological corpus for 17th c. French ; CORPUS17: un corpus philologique pour le 17ème siècle français
|
|
|
|
In: Proceedings of the 2nd International Digital Tools & Uses Congress (DTUC ’20) ; https://hal.archives-ouvertes.fr/hal-03041871 ; Proceedings of the 2nd International Digital Tools & Uses Congress (DTUC ’20), Oct 2020, Hammamet, Tunisia. ⟨10.1145/3423603.3424002⟩ (2020)
|
|
BASE
|
|
Show details
|
|
9 |
La traduction normative entre langues romanes (castillan-catalan) ... : Étude traductologique du processus d’approbation du statut d’autonomie de la Catalogne ...
|
|
|
|
BASE
|
|
Show details
|
|
10 |
Sexting en adolescentes: Prevalencia y comportamientos
|
|
|
|
In: Comunicar: Revista científica iberoamericana de comunicación y educación, ISSN 1134-3478, Nº 64, 2020, pags. 9-18 (2020)
|
|
BASE
|
|
Show details
|
|
11 |
Unsupervised Machine Learning & Prediction of Latent Structures Using an Enhanced Bi-LSTM Model for Writing Normalisation
|
|
|
|
In: CIDE 2019 ; https://hal-cnam.archives-ouvertes.fr/hal-02476675 ; CIDE 2019, Apr 2019, Djerba, Tunisia (2019)
|
|
BASE
|
|
Show details
|
|
12 |
ترجمة المصطلحات العلمية بين النظرية والتطبيق ; Equivalence in Scientific Terminology: Theory and Practice ; L’équivalence en terminologie scientifique : théorie et pratique
|
|
|
|
In: ISSN: 2550-651X ; Revue des Langues, cultures et sociétés ; https://hal.univ-lorraine.fr/hal-02977623 ; Revue des Langues, cultures et sociétés, IMIST, 2019, La traduction aujourd’hui : théorie et pratiques, 5 (1), pp.132-142. ⟨10.48384/IMIST.PRSM/lcs-v5i1.15568⟩ (2019)
|
|
BASE
|
|
Show details
|
|
16 |
Data from: Dogs perceive and spontaneously normalise formant-related speaker and vowel differences in human speech sounds ...
|
|
|
|
BASE
|
|
Show details
|
|
17 |
Simplifying EU legislative texts: the contribution of translation
|
|
Seracini, Francesca (orcid:0000-0003-3769-773X). - : Pisa University Press, 2019. : country:ITA, 2019. : place:Pisa, 2019
|
|
BASE
|
|
Show details
|
|
18 |
Transforming acoustic vowel data : A comparison of methods, using multi-dimensional scaling
|
|
|
|
BASE
|
|
Show details
|
|
19 |
Spelling Normalisation of Basque Historical Texts ; Normalización de Textos Históricos Vascos
|
|
|
|
BASE
|
|
Show details
|
|
20 |
Topoï et légitimation des politiques austéritaires. Une étude des éditoriaux de La Presse de 1980 à 2015
|
|
|
|
In: Langage et société, N 166, 1, 2019-01-11, pp.117-138 (2019)
|
|
BASE
|
|
Show details
|
|
|
|