DE eng

Search in the Catalogues and Directories

Hits 1 – 3 of 3

1
A Spanish learner oral corpus for computer-aided error analysis
In: Corpora. - Edinburgh : Univ. Press 9 (2014) 2, 207-238
OLC Linguistik
Show details
2
Errores léxicos en el español oral no nativo: análisis de la interlengua basado en corpus ; Lexical errors in non-native oral Spanish: a corpus-based error analysis
Campillos Llanos, Leonardo. - : Universidad de Alicante. Departamento de Filología Española, Lingüística General y Teoría de la Literatura, 2014
BASE
Show details
3
Collecting and POS-tagging a lexical resource of Japanese biomedical terms from a corpus ; Recogida y etiquetado morfológico de un lexicón de términos biomédicos en japonés a partir de corpus
Herrero Zorita, Carlos; Campillos Llanos, Leonardo; Moreno Sandoval, Antonio. - : Sociedad Española para el Procesamiento del Lenguaje Natural, 2014
Abstract: The following paper explains the methodology followed for the creation of a morphologically tagged medical lexicon in Japanese. In order to build this medical resource we have taken into account the morphosyntactic characteristics of the language as well as the origins and formation of the medical terms. Following this, we have compiled a list using the Japanese MutiMedica corpus, special tags from a POS tagger, and several specialised medical dictionaries. After considering three different taggers (ChaSen, Mecab, Juman) we finally chose Juman for the tagging of the lexicon. The problem of the oversegmentation of the language was then corrected and the tags have been normalised. This resource is the base component for the creation of a medical term extractor. ; El artículo resume el proceso de recopilación de un lexicón de términos biomédicos en japonés etiquetados morfológicamente. En primer lugar se han considerado para esta tarea las características morfosintácticas del japonés así como el origen y formación de los términos médicos en esta lengua. Posteriormente la lista se ha recopilado utilizando el corpus japonés MultiMedica, las etiquetas especiales de un etiquetador morfológico y varios diccionarios médicos especializados. Para el siguiente proceso de etiquetado se han considerado tres etiquetadores japoneses (ChaSen, Mecab, Juman), de los cuales se ha escogido este último. Una vez etiquetado, se ha corregido el problema de la sobresegmentación de los términos japoneses y se han simplificado las etiquetas para el propósito de nuestra tarea. Este recurso es la base para la creación de un extractor de términos médicos en japonés. ; This research has been funded by the MINECO (under the grant TIN2010-20644-C03-03) and by the Madrid Regional Government (grant MA2VICMR).
Keyword: Análisis morfológico; Japanese; Japonés; Lenguajes y Sistemas Informáticos; Lexical resource; Medical terminology; POS tagging; Recurso léxico; Terminología médica
URL: http://hdl.handle.net/10045/35765
BASE
Hide details

Catalogues
0
0
1
0
0
0
0
Bibliographies
0
0
0
0
0
0
0
0
0
Linked Open Data catalogues
0
Online resources
0
0
0
0
Open access documents
2
0
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern