1 |
Raising the Titanic: Prospects for Reviving the Century Dictionary ...
|
|
|
|
BASE
|
|
Show details
|
|
2 |
Exploiting Script Similarities to Compensate for the Large Amount of Data in Training Tesseract LSTM: Towards Kurdish OCR
|
|
|
|
In: Applied Sciences ; Volume 11 ; Issue 20 (2021)
|
|
BASE
|
|
Show details
|
|
5 |
NAT: Noise-Aware Training for Robust Neural Sequence Labeling
|
|
|
|
In: Fraunhofer IAIS (2020)
|
|
BASE
|
|
Show details
|
|
6 |
OPTICAL CHARACTER RECOGNITION APPLIED TO ANDROID-BASED BILINGUAL TRANSLATOR APPLICATION (ENGLISH AND INDONESIAN) TO SIGN LANGUAGE ...
|
|
|
|
BASE
|
|
Show details
|
|
7 |
OPTICAL CHARACTER RECOGNITION APPLIED TO ANDROID-BASED BILINGUAL TRANSLATOR APPLICATION (ENGLISH AND INDONESIAN) TO SIGN LANGUAGE ...
|
|
|
|
BASE
|
|
Show details
|
|
8 |
Bilingual text detection in natural scene images using invariant moments
|
|
|
|
BASE
|
|
Show details
|
|
9 |
Wenn Algorithmen Zeitschriften lesen - vom Mehrwert automatisierter Textanreicherung ...
|
|
|
|
Abstract:
Mit der Plattform E-Periodica (www.e-periodica.ch) stellt die ETH-Bibliothek rund 280 retrodigitalisierte Schweizer Fachzeitschriften mit insgesamt über 6 Mio. Seiten online zur Verfügung. Diese Menge an OCR-erkannten Texten bieten sich an, um dank automatisierter Textanreicherung zusätzlichen Mehrwert für die bessere Nutzbarkeit der Daten zu generieren. Vor diesem Hintergrund führte die ETH-Bibliothek gemeinsam mit dem Institut für Computerlinguistik der Universität Zürich im Jahr 2017 ein entsprechendes Pilotprojekt durch. Als Testkorpus wurden zwei umfangreiche Architekturzeitschriften (ab 1874 bis in die Gegenwart) mit computerlinguistischen Methoden aufbereitet, strukturiert und verlinkt. Im Vortrag werden zum einen die methodischen Schwerpunkte der verbesserten Texterkennung (durch die automatische Korrektur von OCR-Fehlern) und der Textanreicherung - durch die Erkennung, die Aggregierung und die Verlinkung von Personen- und Ortsnamen - ausgeführt. Zum anderen wird gezeigt, welche Resultate sich für ...
|
|
Keyword:
Automatische Textanreicherung; COMPUTERLINGUISTIK; Named entity linking NEL; Named entity recognition NER; Optical character recognition OCR
|
|
URL: http://hdl.handle.net/20.500.11850/270809 https://dx.doi.org/10.3929/ethz-b-000270809
|
|
BASE
|
|
Hide details
|
|
10 |
Generating a training corpus for OCR post-correction using encoder-decoder model
|
|
|
|
In: Proceedings of the Eighth International Joint Conference on Natural Language Processing (Volume 1: Long Papers) ; International Joint Conference on Natural Language Processing ; https://hal.archives-ouvertes.fr/hal-01831147 ; International Joint Conference on Natural Language Processing, Nov 2017, Taipei, Taiwan ; https://www.aclweb.org/anthology/I17-1101 (2017)
|
|
BASE
|
|
Show details
|
|
11 |
Corpus linguistics for History ... : the methodology of investigating place-name discourses in digitised nineteenth-century newspapers ...
|
|
|
|
BASE
|
|
Show details
|
|
12 |
Radical Recognition in Off-Line Handwritten Chinese Characters Using Non-Negative Matrix Factorization
|
|
|
|
In: Senior Projects Spring 2016 (2016)
|
|
BASE
|
|
Show details
|
|
13 |
Drifting through Basic Subprocesses of Reading: A Hierarchical Diffusion Model Analysis of Age Effects on Visual Word Recognition
|
|
|
|
In: ISSN: 1664-1078 ; Frontiers in Psychology ; https://hal-amu.archives-ouvertes.fr/hal-01522738 ; Frontiers in Psychology, Frontiers, 2016, 7, pp.1863 - 1863. ⟨10.3389/fpsyg.2016.01863⟩ (2016)
|
|
BASE
|
|
Show details
|
|
14 |
Using SMT for OCR error correction of historical texts
|
|
|
|
In: Afli, Haithem orcid:0000-0002-7449-4707 , Qui, Zhengwei, Way, Andy orcid:0000-0001-5736-5930 and Sheridan, Páraic (2016) Using SMT for OCR error correction of historical texts. In: Tenth International Conference on Language Resources and Evaluation (LREC 2016), 23-28 May 2016, Portorož, Slovenia. ISBN 978-2-9517408-9-1 (2016)
|
|
BASE
|
|
Show details
|
|
15 |
Data Cleaning for XML Electronic Dictionaries via Statistical Anomaly Detection ...
|
|
|
|
BASE
|
|
Show details
|
|
16 |
Drifting through Basic Subprocesses of Reading ... : A Hierarchical Diffusion Model Analysis of Age Effects on Visual Word Recognition ...
|
|
|
|
BASE
|
|
Show details
|
|
17 |
Assessing the modified receptive field (MRF) theory: evidence from Sinhalese-English bilinguals
|
|
|
|
In: School of Health and Human Sciences (2016)
|
|
BASE
|
|
Show details
|
|
18 |
ERPs Reveal the Time-Course of Aberrant Visual-Phonological Binding in Developmental Dyslexia
|
|
|
|
BASE
|
|
Show details
|
|
19 |
Data Cleaning for XML Electronic Dictionaries via Statistical Anomaly Detection
|
|
|
|
BASE
|
|
Show details
|
|
20 |
Language identification from handwritten documents
|
|
|
|
In: 2015 13th International Conference on Document Analysis and Recognition (ICDAR) ; https://hal-normandie-univ.archives-ouvertes.fr/hal-02087612 ; 2015 13th International Conference on Document Analysis and Recognition (ICDAR), Aug 2015, Tunis, Tunisia. pp.676-680, ⟨10.1109/ICDAR.2015.7333847⟩ (2015)
|
|
BASE
|
|
Show details
|
|
|
|