DE eng

Search in the Catalogues and Directories

Hits 1 – 1 of 1

1
Fouille de données séquentielles pour l'extraction d'information dans les textes
In: ISSN: 1248-9433 ; EISSN: 1965-0906 ; Revue TAL ; https://hal.archives-ouvertes.fr/hal-01011618 ; Revue TAL, ATALA (Association pour le Traitement Automatique des Langues), 2009, pp59-87 (2009)
Abstract: International audience ; Cet article montre l'intérêt d'utiliser les motifs issus des méthodes de fouille de données dans le domaine du TAL appliqué à la biologie médicale et génétique, et plus particulièrement dans les tâches d'extraction d'information. Nous proposons une approche pour apprendre les patrons linguistiques par une méthode de fouille de données fondée sur les motifs séquentiels et sur une fouille dite récursive des motifs eux-mêmes. Une originalité de notre approche est de s'affranchir de l'analyse syntaxique tout en permettant de produire des résultats symboliques, intelligibles pour l'utilisateur, a contrario des méthodes numériques qui restent difficilement interprétables. Elle ne nécessite pas de ressources linguistiques autres que le corpus d'apprentissage. Pour la reconnaissance d'entités biologiques nommées, nous proposons une méthode fondée sur un nouveau type de motifs intégrant une séquence et son contexte. This paper shows the benefit of using data mining methods for Biological Natural Language Processing. A method for discovering linguistic patterns based on a recursive sequential pattern mining is proposed. It does not require a sentence parsing nor other resource except a training data set. It produces understandable results and we show its interest in the extraction of relations between named entities. For the named entities recognition problem, we propose a method based on a new kind of patterns taking account the sequence and its context.
Keyword: [INFO.INFO-TT]Computer Science [cs]/Document and Text Processing; BioNLP; data mining; extraction d'information; fouille de données; information extraction; motifs séquentiels et motifs LSR; sequential patterns and LSR patterns; TAL appliqué aux textes biologiques et génétiques
URL: https://hal.archives-ouvertes.fr/hal-01011618
https://hal.archives-ouvertes.fr/hal-01011618/document
https://hal.archives-ouvertes.fr/hal-01011618/file/RIACL-CHARNOIS-2009-1.pdf
BASE
Hide details

Catalogues
0
0
0
0
0
0
0
Bibliographies
0
0
0
0
0
0
0
0
0
Linked Open Data catalogues
0
Online resources
0
0
0
0
Open access documents
1
0
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern