DE eng

Search in the Catalogues and Directories

Hits 1 – 3 of 3

1
A Corpus-based Survey of Four Electronic Swahili–English Bilingual Dictionaries
In: Lexikos, Vol 19 (2011) (2011)
BASE
Show details
2
Dictionary Writing System (DWS) + Corpus Query Package (CQP): The Case of TshwaneLex
In: Lexikos, Vol 17 (2011) (2011)
Abstract: Abstract: In this article the integrated corpus query functionality of the dictionary compilation software TshwaneLex is analysed. Attention is given to the handling of both raw corpus data and annotated corpus data. With regard to the latter it is shown how, with a minimum of human effort, machine learning techniques can be employed to obtain part-of-speech tagged corpora that can be used for lexicographic purposes. All points are illustrated with data drawn from English and Northern Sotho. The tools and techniques themselves, however, are language-independent, and as such the encouraging outcomes of this study are far-reaching. Keywords: LEXICOGRAPHY, DICTIONARY, SOFTWARE, DICTIONARY WRITING SYS-TEM (DWS), CORPUS QUERY PACKAGE (CQP), TSHWANELEX, CORPUS, CORPUS ANNO-TATION, PART-OF-SPEECH TAGGER (POS-TAGGER), MACHINE LEARNING, NORTHERN SOTHO (SESOTHO SA LEBOA) Samenvatting: Woordenboekaanmaaksysteem + corpusanalysepakket: een studie van TshwaneLex. In dit artikel wordt het geïntegreerde corpusanalysepakket van het woordenboekaanmaaksysteem TshwaneLex geanalyseerd. Aandacht gaat zowel naar het verwer-ken van onbewerkte corpusdata als naar geannoteerde corpusdata. Wat het laatste betreft wordt aangetoond hoe, met een minimum aan intellectuele arbeid, automatische leertechnieken met suc-ces kunnen worden ingezet om corpora voor lexicografische doeleinden aan te maken waarin de woordklassen expliciet worden vermeld. Alle stappen van de redenering worden geïllustreerd met gegevens uit het Engels en Noord-Sotho. De instrumenten en technieken zelf zijn echter allemaal taalonafhankelijk, waardoor de veelbelovende resultaten van deze studie verreikend zijn. Sleutelwoorden: LEXICOGRAFIE, WOORDENBOEK, SOFTWARE, WOORDENBOEK-AANMAAKSYSTEEM, CORPUSANALYSEPAKKET, TSHWANELEX, CORPUS, CORPUSANNO-TATIE, WOORDKLASSETAGGER, AUTOMATISCHE LEERTECHNIEKEN, NOORD-SOTHO
Keyword: Africa; CORPUS; CORPUS ANNO-TATION; CORPUS QUERY PACKAGE (CQP); DICTIONARY; DICTIONARY WRITING SYS-TEM (DWS); Germanic languages. Scandinavian languages; Languages and literature of Eastern Asia; LEXICOGRAPHY; MACHINE LEARNING; NORTHERN SOTHO (SESOTHO SA LEBOA); Oceania; P1-1091; PART-OF-SPEECH TAGGER (POS-TAGGER); PD1-7159; Philology. Linguistics; PL1-8844; SOFTWARE; TSHWANELEX
URL: https://doaj.org/article/1f92b88eb22a47299ebfafbb99bdc4fa
https://doi.org/10.5788/17--520
BASE
Hide details
3
Improving the Computational Morphological Analysis of a Swahili Corpus for Lexicographic Purposes
In: Lexikos, Vol 18 (2011) (2011)
BASE
Show details

Catalogues
0
0
0
0
0
0
0
Bibliographies
0
0
0
0
0
0
0
0
0
Linked Open Data catalogues
0
Online resources
0
0
0
0
Open access documents
3
0
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern