1 |
Guidelines for linguistic annotation of modern French (16th-18th c.) ; Manuel d'annotation linguistique pour le français moderne (XVIe -XVIIIe siècles)
|
|
|
|
In: https://hal.archives-ouvertes.fr/hal-02571190 ; 2020 (2020)
|
|
BASE
|
|
Show details
|
|
2 |
Standardizing linguistic data: method and tools for annotating (pre-orthographic) French ; Standardiser les données linguistiques: méthodes et outils pour l'annotation du français (pré-orthographique)
|
|
|
|
In: Proceedings of the 2nd International Digital Tools & Uses Congress (DTUC '20) ; https://hal.archives-ouvertes.fr/hal-03018381 ; Proceedings of the 2nd International Digital Tools & Uses Congress (DTUC '20), Oct 2020, Hammamet, Tunisia. ⟨10.1145/3423603.3423996⟩ (2020)
|
|
BASE
|
|
Show details
|
|
3 |
SudachiPy VS spaCy
|
|
|
|
In: ISSN: 2729-465X ; Tekipaki ; https://hal.archives-ouvertes.fr/hal-03079649 ; 2020, https://tekipaki.hypotheses.org/755 (2020)
|
|
BASE
|
|
Show details
|
|
4 |
Modèles chinois et japonais pour spaCy
|
|
|
|
In: ISSN: 2729-465X ; Tekipaki ; https://hal.archives-ouvertes.fr/hal-03037800 ; 2020, https://tekipaki.hypotheses.org/576 (2020)
|
|
BASE
|
|
Show details
|
|
5 |
Étiquetage morphosyntaxique avec Jieba
|
|
|
|
In: ISSN: 2729-465X ; Tekipaki ; https://hal.archives-ouvertes.fr/hal-03030765 ; 2020, https://tekipaki.hypotheses.org/115 (2020)
|
|
BASE
|
|
Show details
|
|
6 |
Étiquetage morphosyntaxique avec PyNLPIR
|
|
|
|
In: ISSN: 2729-465X ; Tekipaki ; https://halshs.archives-ouvertes.fr/halshs-03025755 ; 2020, https://tekipaki.hypotheses.org/117 (2020)
|
|
BASE
|
|
Show details
|
|
8 |
Standardizing linguistic data: method and tools for annotating(pre-orthographic) French ...
|
|
|
|
BASE
|
|
Show details
|
|
9 |
Standardizing linguistic data: method and tools for annotating(pre-orthographic) French ...
|
|
|
|
BASE
|
|
Show details
|
|
10 |
SudachiPy VS spaCy
|
|
|
|
In: ISSN: 2729-465X ; Tekipaki ; https://hal.archives-ouvertes.fr/hal-03079649 ; 2020, https://tekipaki.hypotheses.org/755 (2020)
|
|
BASE
|
|
Show details
|
|
11 |
Étiquetage morphosyntaxique avec Jieba
|
|
|
|
In: ISSN: 2729-465X ; Tekipaki ; https://hal.archives-ouvertes.fr/hal-03030765 ; 2020, https://tekipaki.hypotheses.org/115 (2020)
|
|
BASE
|
|
Show details
|
|
12 |
Modèles chinois et japonais pour spaCy
|
|
|
|
In: ISSN: 2729-465X ; Tekipaki ; https://hal.archives-ouvertes.fr/hal-03037800 ; 2020, https://tekipaki.hypotheses.org/576 (2020)
|
|
BASE
|
|
Show details
|
|
13 |
Étiquetage morphosyntaxique avec PyNLPIR
|
|
|
|
In: ISSN: 2729-465X ; Tekipaki ; https://halshs.archives-ouvertes.fr/halshs-03025755 ; 2020, https://tekipaki.hypotheses.org/117 (2020)
|
|
BASE
|
|
Show details
|
|
14 |
Les eines computacionals i el disseny de corpus orals: un diàleg vigent ; Computational tools and spoken corpora design: an ongoing dialogue
|
|
|
|
In: Caplletra. Revista Internacional de Filologia.; Caplletra 69 (tardor 2020); 221-240 ; Caplletra. Revista Internacional de Filologia; Caplletra 69 (tardor 2020); 221-240 ; 2386-7159 ; 0214-8188 (2020)
|
|
BASE
|
|
Show details
|
|
15 |
An Urdu semantic tagger - lexicons, corpora, methods and tools ...
|
|
|
|
BASE
|
|
Show details
|
|
16 |
Digital-linguistische Annotation neulateinischer Texte
|
|
|
|
Abstract:
Vorliegende Arbeit versammelt Erkenntnisse, die im Zuge computergestützter linguistischer Annotation ausgewählter frühneuzeitlicher Gelehrtenbriefe neulateinischer Sprache gewonnen wurden (Briefe des Historikers und Bibliothekars Johann Georg Eckhart an die Melker Geschichtsforscher Bernhard und Hieronymus Pez OSB). Die Absicht vorliegender Arbeit besteht darin, das Potential digitaler, linguistischer Annotation anhand von neulateinischen Texten aufzuzeigen. Digital-linguistische Annotation (linguistisches Tagging) stellt innerhalb der Corpuslinguistik und der Digital Humanities ein anerkanntes Verfahren dar, das zumeist auf modernsprachliche Textsammlungen angewandt wird. Es zielt auf die sprachwissenschaftliche Auswertung mitunter sehr großer Textquanten. Durch linguistische Annotation werden die in einem Text enthaltenen sprachlichen Informationen, z.B. Wortarten, morphologische Phänomene, explizit gemacht, maschinell les- und verarbeitbar. Somit wird eine Ausgangsbasis geschaffen für diachrone, sprachliche Vergleiche älterer Sprachstufen. Ferner kommt linguistische Annotation der systematischen Durchsuchbarkeit schriftlicher Quellen in höchstem Maße zugute. Vorliegende Arbeit befasst sich mit dem Begriff, dem aktuellen Forschungsstand, der Praxis und den gängigsten Varianten linguistischer Annotation und wendet ausgewählte Teile ihres Methodenspektrums speziell auf neulateinische Gelehrtenbriefe in digitaler Form an. Im Zentrum steht dabei die Frage, welche Standards und welche Varianten linguistischer Annotation in Hinblick auf die digitale Edition neulateinischer Quellen am besten geeignet erscheinen. Zur Diskussion stehen: linguistische Basisannotation mit Kennzeichnung der Wortarten und Ausweis der Grundworte (Lemmatisierung), andererseits morphologische Annotation und Treebanking. Ferner werden Annotationsschemata (Tagsets) evaluiert, die im Rahmen einschlägiger Projekte der jüngeren Vergangenheit auf Texte lateinischer Sprache angewandt wurden (v.a. im Rahmen der Perseus Digital Library sowie des Index Thomisticus Online). Auf Basis der annotierten Briefe bietet vorliegende Arbeit semantische Analysen ausgewählter Begriffe sowie von deren sprachlichem Kontext: Analysiert werden z.B. Termini wie codex, liber oder manuscriptum. Diese Begriffe sind innerhalb der Korrespondenz zwischen Eckhart, Pez und anderen von zentraler Bedeutung für deren Interessen als Geschichtsforscher. Die im Zuge der praktischen Annotation generierten Daten, die annotierten Briefe in digitaler Form, sind am Server des Austrian Centre for Digital Humanities der Österreichischen Akademie der Wissenschaften in Wien gespeichert. Interessierten Forscherinnen und Forschern können sie auf Anfrage zugänglich gemacht werden. Jenes webbasierte Tool, mit dem die Annotation durchgeführt wurde, wird in vorliegender Arbeit ausführlich vorgestellt und beschrieben – der vom ACDH der ÖAW entwickelte TokenEditor.
|
|
Keyword:
10.03 Methoden und Techniken der geisteswissenschaftlichen Forschung; 15.03 Theorie und Methoden der Geschichtswissenschaft; 15.10 Historische Hilfswissenschaften; 15.34 Europäische Geschichte 1492-1789; 17.15 Historische Linguistik; Digital Humanities / linguistic annotation / PoS-Tagging / Neolatin / tagsets / XML / letters / Bernhard Pez / Johann Georg Eckhart / morphology; Digital Humanities / linguistische Annotation / PoS-Tagging / Neulatein / Tagsets / XML / Gelehrtenbriefe / Bernhard Pez / Johann Georg Eckhart / Corpuslinguistik
|
|
URL: http://othes.univie.ac.at/58660/
|
|
BASE
|
|
Hide details
|
|
17 |
Inducing Multilingual Text Analysis Tools Using Bidirectional Recurrent Neural Networks
|
|
|
|
In: COLING 2016 ; https://hal.archives-ouvertes.fr/hal-01374205 ; COLING 2016, ANLP, Dec 2016, Osaka, Japan ; http://coling2016.anlp.jp (2016)
|
|
BASE
|
|
Show details
|
|
18 |
Web-Application for the Presentation of Bilingual Corpora (Focusing on Bulgarian as One of the Two Paired Languages)
|
|
|
|
In: Cognitive Studies | Études cognitives; No 13 (2013); 183-193 ; 2392-2397 (2015)
|
|
BASE
|
|
Show details
|
|
|
|