1 |
Information extraction from bibliography for Marker Assisted Selection in wheat
|
|
|
|
In: Metadata and Semantics Research ; MTSR 2014 : 8th Metadata and Semantics ; https://hal.archives-ouvertes.fr/hal-01132767 ; MTSR 2014 : 8th Metadata and Semantics, Nov 2014, Karlsruhe, Germany. pp.301-313, ⟨10.1007/978-3-319-13674-5_28⟩ ; https://archives-publications.inrae.fr/279506 (2014)
|
|
BASE
|
|
Show details
|
|
2 |
Structural Sentence Decomposition via Open Information Extraction
|
|
|
|
In: 18th International Conference Information Visualisation (IV2014) ; https://hal.archives-ouvertes.fr/hal-01301084 ; 18th International Conference Information Visualisation (IV2014), Jul 2014, University of Paris Descartes, France. pp.1-6 (2014)
|
|
BASE
|
|
Show details
|
|
3 |
Représentation OWL de la ressource lexicale LVF et son utilisation dans le traitement automatique de la langue
|
|
|
|
BASE
|
|
Show details
|
|
4 |
Extraction automatique et visualisation des thèmes abordés dans des résumés de mémoires et de thèses en anthropologie au Québec, de 1985 à 2009
|
|
|
|
BASE
|
|
Show details
|
|
7 |
Overview of the ShARe/CLEF eHealth evaluation lab 2014
|
|
|
|
In: Kelly, Liadh orcid:0000-0003-1131-5238 , Goeuriot, Lorraine orcid:0000-0001-7491-1980 , Suominen, Hanna, Schreck, Tobias, Leroy, Gondy, Mowery, Danielle L., Velupillai, Sumithra, Chapman, Wendy, Martinez, David, Zuccon, Guido and Palotti, Joao (2014) Overview of the ShARe/CLEF eHealth evaluation lab 2014. Lecture Notes in Computer Science, 8685 . pp. 172-191. ISSN 0302-9743 (2014)
|
|
BASE
|
|
Show details
|
|
8 |
ПРИМЕНЕНИЕ МАСШТАБНЫХ ЛИНГВИСТИЧЕСКИХ РЕСУРСОВ ДЛЯ РАСШИРЕНИЯ ОНТОЛОГИИ ПРЕДМЕТНОЙ ОБЛАСТИ (НА ПРИМЕРЕ ОБЛАСТИ «РАДИАЦИОННАЯ БЕЗОПАСНОСТЬ»)
|
|
|
|
BASE
|
|
Show details
|
|
9 |
Towards a mixed approach to extract biomedical terms from text corpus
|
|
|
|
In: ISSN: 1947-9115 ; EISSN: 1947-9123 ; International journal of Knowledge Discovery in Bioinformatics ; https://hal-lirmm.ccsd.cnrs.fr/lirmm-00859846 ; International journal of Knowledge Discovery in Bioinformatics, IGI Global, 2014, 4 (1), pp.1-15. ⟨10.4018/ijkdb.2014010101⟩ ; http://www.igi-global.com/journal/international-journal-knowledge-discovery-bioinformatics/1143 (2014)
|
|
BASE
|
|
Show details
|
|
10 |
Minimum Redundancy and Maximum Relevance for Single and multi-document Arabic Text Summarization
|
|
|
|
In: ISSN: 1319-1578 ; EISSN: 1319-1578 ; Journal of King Saud University - Computer and Information Sciences ; https://hal.archives-ouvertes.fr/hal-01486088 ; Journal of King Saud University - Computer and Information Sciences, Elsevier 2014, 26 (4), pp.450-461. ⟨10.1016/j.jksuci.2014.06.008⟩ (2014)
|
|
BASE
|
|
Show details
|
|
11 |
Event role extraction using domain-relevant word representations
|
|
|
|
In: Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP) ; https://hal-cea.archives-ouvertes.fr/cea-01844443 ; Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP), Oct 2014, Doha, Qatar. pp.1852-1857 (2014)
|
|
BASE
|
|
Show details
|
|
12 |
Sequential pattern mining in order to discover relations between genes and rares diseases ; Fouille de motifs séquentiels pour la découverte de relations entre gènes et maladies rares
|
|
|
|
In: ISSN: 0992-499X ; EISSN: 1958-5748 ; Revue des Sciences et Technologies de l'Information - Série RIA : Revue d'Intelligence Artificielle ; https://hal.archives-ouvertes.fr/hal-01119525 ; Revue des Sciences et Technologies de l'Information - Série RIA : Revue d'Intelligence Artificielle, Lavoisier, 2014, 28/2-3, pp.245-270 (2014)
|
|
BASE
|
|
Show details
|
|
13 |
Extraction de données orales multi-annotées
|
|
|
|
In: Traitement Automatique du Langage Naturel 21 ; https://hal.archives-ouvertes.fr/hal-01500722 ; Traitement Automatique du Langage Naturel 21, Jul 2014, Marseille, France. pp.556-561 (2014)
|
|
BASE
|
|
Show details
|
|
14 |
Fast recursive biomedical event extraction ; Extraction rapide et récursive des événements biomédicaux
|
|
|
|
In: https://tel.archives-ouvertes.fr/tel-01690893 ; Artificial Intelligence [cs.AI]. Université de Technologie de Compiègne, 2014. English. ⟨NNT : 2014COMP1963⟩ (2014)
|
|
Abstract:
Internet as well as all the modern media of communication, information and entertainment entails a massive increase of digital data quantities. Automatically processing and understanding these massive data enables creating large knowledge bases, more efficient search, social medial research, etc. Natural language processing research concerns the design and development of algorithms that allow computers to process natural language in texts, audios, images or videos automatically for specific tasks. Due to the complexity of human language, natural language processing of text can be divided into four levels: morphology, syntax, semantics and pragmatics. Current natural language processing technologies have achieved great successes in the tasks of the first two levels, leading to successes in many commercial applications such as search. However, advanced structured search engine would require computers to understand language deeper than at the morphology and syntactic levels. Information extraction is designed to extract meaningful structural information from unannotated or semi-annotated resources to enable advanced search and automatically create knowledge bases for further use. This thesis studies the problem of information extraction in the specific domain of biomedical event extraction. We propose an efficient solution, which is a trade-off between the two main trends of methods proposed in previous work. This solution reaches a good balance point between performance and speed, which is suitable to process large scale data. It achieves competitive performance to the best models with a much lower computational complexity. While designing this model, we also studied the effects of different classifiers that are usually proposed to solve the multi-class classification problem. We also tested two simple methods to integrate word vector representations learned by deep learning method into our model. Even if different classifiers and the integration of word vectors do not greatly improve the performance, we believe that these research directions carry some promising potential for improving information extraction. ; L’internet et les nouvelles formes de média de communication, d’information, et de divertissement ont entraîné une croissance massive de la quantité des données numériques. Le traitement et l’interprétation automatique de ces données permettent de créer des bases de connaissances, de rendre les recherches plus efficaces et d’effectuer des recherches sur les médias sociaux. Les travaux de recherche sur le traitement automatique du langage naturel concernent la conception et le développement d’algorithmes, qui permettent aux ordinateurs de traiter automatiquement le langage naturel dans les textes, les contenus audio, les images ou les vidéos, pour des tâches spécifiques. De par la complexité du langage humain, le traitement du langage naturel sous forme textuelle peut être divisé en 4 niveaux : la morphologie, la syntaxe, la sémantique et la pragmatique. Les technologies actuelles du traitement du langage naturel ont eu de grands succès sur les tâches liées auxdeux premiers niveaux, ce qui a permis la commercialisation de beaucoup d’applications comme les moteurs de recherche. Cependant, les moteurs de recherches avancés (structurels) nécessitent une interprétation du langage plus avancée. L’extraction d’information consiste à extraire des informations structurelles à partir des ressources non annotées ou semi-annotées, afin de permettre des recherches avancées et la création automatique des bases de connaissances. Cette thèse étudie le problème d’extraction d’information dans le domaine spécifique de l’extraction des événements biomédicaux. Nous proposons une solution efficace, qui fait un compromis entre deux types principaux de méthodes proposées dans la littérature. Cette solution arrive à un bon équilibre entre la performance et la rapidité, ce qui la rend utilisable pour traiter des données à grande échelle. Elle a des performances compétitives face aux meilleurs modèles existant avec une complexité en temps de calcul beaucoup plus faible. Lors la conception de ce modèle, nous étudions également les effets des différents classifieurs qui sont souvent proposés pour la résolution des problèmes de classification multi-classe. Nous testons également deux méthodes permettant d’intégrer des représentations vectorielles des mots appris par apprentissage profond (deep learning). Même si les classifieurs différents et l’intégration des vecteurs de mots n’améliorent pas grandement la performance, nous pensons que ces directions de recherche ont du potentiel et sont prometteuses pour améliorer l’extraction d’information.
|
|
Keyword:
[INFO.INFO-AI]Computer Science [cs]/Artificial Intelligence [cs.AI]; [INFO.INFO-OH]Computer Science [cs]/Other [cs.OH]; [SPI.OTHER]Engineering Sciences [physics]/Other; Artificial intelligence; Classifieur; Deep learning; Extraction d'information; Information extraction; Machine learning; Natural language processing
|
|
URL: https://tel.archives-ouvertes.fr/tel-01690893/file/These_UTC_Xiao_Liu.pdf https://tel.archives-ouvertes.fr/tel-01690893/document https://tel.archives-ouvertes.fr/tel-01690893
|
|
BASE
|
|
Hide details
|
|
15 |
Information extraction for the geospatial domain ... : Informationsextraktion für georäumliche Entitäten und Relationen ...
|
|
|
|
BASE
|
|
Show details
|
|
16 |
Towards Technology Structure Mining from Scientific Literature
|
|
|
|
BASE
|
|
Show details
|
|
18 |
Semi-Supervised Technical Term Tagging With Minimal User Feedback
|
|
|
|
BASE
|
|
Show details
|
|
19 |
Investigating Context Parameters in Technology Term Recognition
|
|
|
|
BASE
|
|
Show details
|
|
20 |
A hybrid model for named entity recognition using unstructured medical text
|
|
|
|
BASE
|
|
Show details
|
|
|
|