DE eng

Search in the Catalogues and Directories

Page: 1 2 3
Hits 1 – 20 of 45

1
Extraction and normalization of simple and structured entities in medical documents ; Extraction et normalisation d'entités simples et structurées dans les documents médicaux
Wajsbürt, Perceval. - : HAL CCSD, 2021
In: https://hal.archives-ouvertes.fr/tel-03624928 ; Document and Text Processing. Sorbonne Université, 2021. English (2021)
Abstract: Hospital clinical documents are rich sources of information for various applications such as patient recruitment for clinical research, epidemiological surveillance, medical coding, and decision support tools. However, being primarily written in natural language, these documents are not easily amenable to large-scale computer processing and must first be structured. We aim to extract entities mentioned in these documents, whether simple or structured, i.e., containing several labels or parts, and normalize them with concept bases. We contribute to several natural language processing (NLP) tasks, namely named entity recognition (NER), medical entity normalization, and structured entity extraction. In particular, we investigate training deep learning models in low data settings, for languages other than English and in the clinical domain. We structure our approach in three steps: tag, normalize, and compose. We first propose two methods to tag simple entities, especially when they overlap in texts. We then develop a large-scale multilingual model to normalize them in several languages. Finally, to compose simple entities into structured entities, we propose a new method based on mention cliques and scope relations. We evaluate it to a new annotated dataset of breast imaging reports. ; Les documents cliniques hospitaliers constituent de riches sources d'information pour diverses applications telles que le recrutement de patients pour la recherche clinique, la surveillance épidémiologique, le codage médical et les outils d'aide à la décision. Cependant, étant essentiellement rédigés en langue naturelle, ces documents ne se prêtent pas aisément à des traitements informatiques à grande échelle et doivent d'abord être structurés.Nous visons à extraire les entités mentionnées dans ces documents, qu'elles soient simples ou structurées, c'est-à-dire contenant plusieurs étiquettes ou parties, et à les normaliser selon des bases de concepts. Nous contribuons à plusieurs tâches de traitement du langage naturel (TAL), à savoir la reconnaissance des entités nommées, la normalisation des entités médicales et l'extraction d'entités structurées. Nous nous intéressons notamment à l'entraînement de modèles par apprentissage profond (deep learning) dans des conditions de données limitées, pour des langues autres que l'anglais et dans le domaine clinique. Nous structurons notre approche en trois étapes : surligner, normaliser et composer. Nous proposons d'abord plusieurs méthodes pour surligner des entités simples, notamment lorsqu'elles se chevauchent dans les textes. Nous développons ensuite une approche multilingue à grande échelle pour les normaliser dans plusieurs langues. Enfin, pour composer ces entités simples en entités structurées, nous proposons une nouvelle méthode basée sur les cliques de mentions et les relations de portée. Nous l'évaluons sur un nouveau corpus annoté de comptes rendus cliniques de mammographies.
Keyword: [INFO.INFO-AI]Computer Science [cs]/Artificial Intelligence [cs.AI]; [INFO.INFO-TT]Computer Science [cs]/Document and Text Processing; [SDV.IB]Life Sciences [q-bio]/Bioengineering; [SDV.SPEE]Life Sciences [q-bio]/Santé publique et épidémiologie; clinical; clinique; extraction; multilingual; multilingue; nlp; normalisation; normalization; structure; tal
URL: https://hal.archives-ouvertes.fr/tel-03624928/file/updated_phd_thesis_PW.pdf
https://hal.archives-ouvertes.fr/tel-03624928
https://hal.archives-ouvertes.fr/tel-03624928/document
BASE
Hide details
2
Document Sub-structure in Neural Machine Translation
In: Proceedings of the 12th Language Resources and Evaluation Conference ; 12th Language Resources and Evaluation Conference ; https://hal.archives-ouvertes.fr/hal-02900568 ; 12th Language Resources and Evaluation Conference, 2020, Marseille, France. pp.3657-3667 (2020)
BASE
Show details
3
An Evaluation Dataset for Identifying Communicative Functions of Sentences in English Scholarly Papers
In: Proceedings of the 12th Conference on Language Resources and Evaluation (LREC 2020) ; 12th Conference on Language Resources and Evaluation (LREC 2020) ; https://hal.archives-ouvertes.fr/hal-03272825 ; 12th Conference on Language Resources and Evaluation (LREC 2020), May 2020, Marseille, France (2020)
BASE
Show details
4
Automatic Learning of Document Section Structure for Ontology-based Semantic Search
In: FIU Electronic Theses and Dissertations (2020)
BASE
Show details
5
Types de chaînes de référence dans les articles de recherche de format IMRaD
In: ISSN: 1963-1723 ; Discours - Revue de linguistique, psycholinguistique et informatique ; https://hal.archives-ouvertes.fr/hal-02476907 ; Discours - Revue de linguistique, psycholinguistique et informatique, Laboratoire LATTICE, 2019 (2019)
BASE
Show details
6
Recent Advances in Development of a Lexicon-Grammar of Polish: PolNet 3.0
In: Tenth International Conference on Language Resources and Evaluation (LREC 2016) ; https://hal.archives-ouvertes.fr/hal-01414304 ; Tenth International Conference on Language Resources and Evaluation (LREC 2016), May 2016, Portorož, Slovenia. pp.2851-2854 ; http://www.lrec-conf.org/proceedings/lrec2016/index.html (2016)
BASE
Show details
7
Joint Anaphoricity Detection and Coreference Resolution with Constrained Latent Structures
In: AAAI Conference on Artificial Intelligence (AAAI 2015) ; https://hal.inria.fr/hal-01205189 ; AAAI Conference on Artificial Intelligence (AAAI 2015), Jan 2015, Austin, Texas, United States (2015)
BASE
Show details
8
Forbidden Extension Queries
Biswas, Sudip; Ganguly, Arnab; Shah, Rahul. - : Schloss Dagstuhl - Leibniz-Zentrum fuer Informatik, 2015. : LIPIcs - Leibniz International Proceedings in Informatics. 35th IARCS Annual Conference on Foundations of Software Technology and Theoretical Computer Science (FSTTCS 2015), 2015
BASE
Show details
9
Identification of Shell Nouns, Signals of Discourse Organisation ; Identification des noms sous-spécifiés, signaux de l’organisation discursive
In: Proceedings of TALN 2014 (Volume 1: Long Papers) ; 21ème conférence sur le Traitement Automatique des Langues Naturelles ; https://hal.archives-ouvertes.fr/hal-01076760 ; 21ème conférence sur le Traitement Automatique des Langues Naturelles, Jul 2014, Marseille, France. pp.377-388 ; https://www.aclweb.org/anthology/F14-1033 (2014)
BASE
Show details
10
Italian Verb-Adverbial Particle Constructions ; Italian Verb-Adverbial Particle Constructions: Predicative structures and patterns of variation
In: ISSN: 0378-4169 ; EISSN: 1569-9927 ; Lingvisticae Investigationes ; https://hal.archives-ouvertes.fr/hal-03321487 ; Lingvisticae Investigationes, Philadelphia; Amsterdam: John Benjamins, 2013, 36 (2), pp.229-243. ⟨10.1075/li.36.2.03gug⟩ (2013)
BASE
Show details
11
Bene : Adverb or noun?
In: ISSN: 0378-4169 ; EISSN: 1569-9927 ; Lingvisticae Investigationes ; https://hal.archives-ouvertes.fr/hal-03321497 ; Lingvisticae Investigationes, Philadelphia; Amsterdam: John Benjamins, 2013, 36 (2), pp.298-310. ⟨10.1075/li.36.2.08mir⟩ (2013)
BASE
Show details
12
Natural Language Generation for Language Learning ; Génération automatique de phrases pour l’apprentissage des langues
PEREZ, Laura Haide. - : HAL CCSD, 2013
In: https://hal.inria.fr/tel-01749799 ; Artificial Intelligence [cs.AI]. Université de Lorraine, 2013. English. ⟨NNT : 2013LORR0062⟩ (2013)
BASE
Show details
13
A semi-automatic approach for building ontologies from a collection of structured web documents
In: K-CAP '13: Proceedings of the seventh international conference on Knowledge capture ; 7th International Conference on Knowledge Capture (K-CAP 2013) ; https://hal.archives-ouvertes.fr/hal-01264565 ; 7th International Conference on Knowledge Capture (K-CAP 2013), Jun 2013, Banff, Canada. pp. 139-140 (2013)
BASE
Show details
14
Emotion verbs in Greek. From Lexicon-Grammar tables to multi-purpose syntactic and semantic lexica
In: 15th EURALEX International Congress (EURALEX 2012) ; https://hal.archives-ouvertes.fr/hal-01414381 ; 15th EURALEX International Congress (EURALEX 2012), Aug 2012, Oslo, Norway (2012)
BASE
Show details
15
Lexique-grammaire des constructions converses en a da/a primi
Ciocanea, Cristiana. - : HAL CCSD, 2011. : Éditions universitaires européennes, 2011
In: https://hal.archives-ouvertes.fr/hal-00797186 ; Éditions universitaires européennes, pp.216, 2011, 978-613-1-59944-6 (2011)
BASE
Show details
16
Pour une classification syntaxique des constructions verbales en coréen
In: Actes du 27ème Colloque international sur le Lexique et la Grammaire ; Colloque international sur le Lexique et la Grammaire ; https://hal.archives-ouvertes.fr/hal-00866246 ; Colloque international sur le Lexique et la Grammaire, Sep 2008, L'Aquila, Italie. pp.51-58 (2008)
BASE
Show details
17
Building a document genre corpus: a profile of the KRYS I corpus
In: http://www.bcs.org/upload/pdf/ewic_ir08_s1paper2.pdf (2008)
BASE
Show details
18
Identifying cross-document relations between sentences
In: http://www.lr.pi.titech.ac.jp/~miyabe/paper/SIGNL_2005Mar2.pdf (2008)
BASE
Show details
19
Using Synchronic and Diachronic Relations for Summarizing Multiple Documents Describing Evolving Events
In: https://hal.archives-ouvertes.fr/hal-00189905 ; 2007 (2007)
BASE
Show details
20
Analyser les structures prédicatives pour mettre en relation des objets scientifiques
In: 10e Colloque International sur le Document Electronique ; https://hal.archives-ouvertes.fr/hal-01194931 ; 10e Colloque International sur le Document Electronique, Jul 2007, Nancy, France (2007)
BASE
Show details

Page: 1 2 3

Catalogues
0
0
0
0
0
0
0
Bibliographies
0
0
0
0
0
0
1
0
0
Linked Open Data catalogues
0
Online resources
0
0
0
0
Open access documents
44
0
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern