DE eng

Search in the Catalogues and Directories

Page: 1 2 3 4 5...14
Hits 1 – 20 of 264

1
SSHOC practical prompts for data and research ...
BASE
Show details
2
SSHOC practical prompts for data and research ...
BASE
Show details
3
The Lannang Corpus (LanCorp): A POS-tagged, sociolinguistic corpus containing recordings and transcriptions of Lannang speech collected from the metropolitan Manila Lannangs between 2016 and 2020 ...
Gonzales, Wilkinson Daniel Wong. - : University of Michigan - Deep Blue Data, 2022
BASE
Show details
4
Atténuer les erreurs de numérisation dans la reconnaissance d'entités nommées pour les documents historiques
In: Conférence en Recherche d'Informations et Applications (CORIA 2021) ; https://hal.archives-ouvertes.fr/hal-03320332 ; Conférence en Recherche d'Informations et Applications (CORIA 2021), ARIA : Association Francophone de Recherche d’Information (RI) et Applications, Apr 2021, Grenoble (virtuel), France. pp.1 - 7 ; http://coria.asso-aria.org/2021/articles/mini_24/main.pdf (2021)
Abstract: National audience ; This paper tackles the task of NER applied to historical texts obtained from processing digital images of news papers using OCR techniques. The main challenge for this task is that the OCR process leads to misspellings and linguistic errors in the output text, which can impact the performance of the NER. We conduct a comparative evaluation on two historical datasets in German and French against previous state-of-the-art models, and we propose a model based ona hierarchical stack of Transformers to approach the NER task for historical data. Our findings show that the proposed model clearly improves the results on both historical data sets ; Cet article aborde la reconnaissance d’entités nommées (NER) appliquée aux textes historiques obtenus à partir du traitement d’images numériques de journaux à l’aide de tech-niques de reconnaissance optique de caractères (OCR). Nous soutenons que le principal défi pour cette tâche est que le processus OCR produit des textes contenant entre autres des fautes d’orthographe et des erreurs de syntaxes. De plus, des variations sémantiques peuvent être présentes dans les documents anciens, ce qui a un impact sur les performances de la reconnaissance d’entités nommées. Nous menons une évaluation comparative à l’état de l’art de deux ensembles de données historiques en allemand et en français, et nous proposons un modèle basé sur une pile hiérarchique de couches Transformer pour aborder la reconnaissance d’entités nommées dans des données historiques. Nos résultats montrent que le modèle proposé améliore clairement les résultats sur les deux ensembles de données
Keyword: [INFO.INFO-AI]Computer Science [cs]/Artificial Intelligence [cs.AI]; [INFO.INFO-CL]Computer Science [cs]/Computation and Language [cs.CL]; [INFO.INFO-DL]Computer Science [cs]/Digital Libraries [cs.DL]; [INFO.INFO-HC]Computer Science [cs]/Human-Computer Interaction [cs.HC]; [INFO.INFO-IR]Computer Science [cs]/Information Retrieval [cs.IR]; [INFO.INFO-LG]Computer Science [cs]/Machine Learning [cs.LG]; [INFO.INFO-TT]Computer Science [cs]/Document and Text Processing; données historiques; données multi-lingues; Extraction d’information; Historical data; Information extraction; Multilingual data; Named entity recognition; reconnaissance d’entités nommées
URL: https://hal.archives-ouvertes.fr/hal-03320332/document
https://hal.archives-ouvertes.fr/hal-03320332
https://hal.archives-ouvertes.fr/hal-03320332/file/main%281%29.pdf
BASE
Hide details
5
Contextualization of Web contents through semantic enrichment from linked open data ; Contextualisation des contenus Web par l'enrichissement sémantique à partir de données
Kumar, Amit. - : HAL CCSD, 2021
In: https://tel.archives-ouvertes.fr/tel-03561788 ; Databases [cs.DB]. Normandie Université, 2021. English. ⟨NNT : 2021NORMC243⟩ (2021)
BASE
Show details
6
Lost in translation: Qualitative data collecting and translating challenges in multilingual settings in information systems research
BASE
Show details
7
Would auto-translation of metadata enhance discovery and impact of research data? ...
BASE
Show details
8
Would auto-translation of metadata enhance discovery and impact of research data? ...
BASE
Show details
9
Report on the Published Updates to CESSDA Vocabulary Service Content ...
Jääskeläinen, Taina. - : Zenodo, 2021
BASE
Show details
10
Report on the Published Updates to CESSDA Vocabulary Service Content ...
Jääskeläinen, Taina. - : Zenodo, 2021
BASE
Show details
11
APiCS-Ligt: Towards Semantic Enrichment of Interlinear Glossed Text ...
Ionov, Maxim. - : Schloss Dagstuhl - Leibniz-Zentrum für Informatik, 2021
BASE
Show details
12
Derzis: A Path Aware Linked Data Crawler ...
Santos, André Fernandes dos; Leal, José Paulo. - : Schloss Dagstuhl - Leibniz-Zentrum für Informatik, 2021
BASE
Show details
13
Improving Multilingual Models for the Swedish Language : Exploring CrossLingual Transferability and Stereotypical Biases
Katsarou, Styliani. - : KTH, Skolan för elektroteknik och datavetenskap (EECS), 2021
BASE
Show details
14
Extending a Text Classifier to Multiple Languages ; Utöka en textklassificeringsmodell till flera språk
Byström, Albin. - : KTH, Skolan för elektroteknik och datavetenskap (EECS), 2021
BASE
Show details
15
LLOD-driven Bilingual Word Embeddings Rivaling Cross-lingual Transformers in Quality of Life Concept Detection from French Online Health Communities ...
BASE
Show details
16
LLOD-driven Bilingual Word Embeddings Rivaling Cross-lingual Transformers in Quality of Life Concept Detection from French Online Health Communities ...
BASE
Show details
17
Analyzing Non-Textual Content Elements to Detect Academic Plagiarism
BASE
Show details
18
A Complete Guide To Digital Concierges In 2021
Singh, Raj. - : Hospitalitynet, 2021
BASE
Show details
19
Flipgrid and Second Language Acquisition Using Flipgrid to Promote Speaking Skills for English Language Learners
In: Master’s Theses and Projects (2020)
BASE
Show details
20
Catalan United Nations v1.0 test set ...
Costa-Jussà, Marta R.. - : Zenodo, 2020
BASE
Show details

Page: 1 2 3 4 5...14

Catalogues
2
0
9
0
0
0
0
Bibliographies
35
0
0
0
0
0
72
0
0
Linked Open Data catalogues
0
Online resources
0
0
0
0
Open access documents
157
0
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern