DE eng

Search in the Catalogues and Directories

Page: 1 2 3
Hits 1 – 20 of 41

1
Pepper for the WiN corpus ...
Krause, Thomas; Klotz, Martin. - : Zenodo, 2022
BASE
Show details
2
Pepper for the WiN corpus ...
Krause, Thomas; Klotz, Martin. - : Zenodo, 2022
BASE
Show details
3
RUEG Corpus ...
BASE
Show details
4
ToolboxTextModules ...
Druskat, Stephan; Krause, Thomas. - : Zenodo, 2021
BASE
Show details
5
RUEG Corpus ...
BASE
Show details
6
ToolboxTextModules ...
Druskat, Stephan; Krause, Thomas. - : Zenodo, 2021
BASE
Show details
7
ANNIS ...
BASE
Show details
8
RUEG Corpus ...
BASE
Show details
9
korpling/graphANNIS: test-release-deploy-please-ignore ...
Krause, Thomas. - : Zenodo, 2020
BASE
Show details
10
korpling/graphANNIS: Please ignore this test release to test the new deploy process ...
Krause, Thomas. - : Zenodo, 2020
BASE
Show details
11
ANNIS: A graph-based query system for deeply annotated text corpora ...
Krause, Thomas. - : Humboldt-Universität zu Berlin, 2019
BASE
Show details
12
korpling/graphANNIS v0 ...
Krause, Thomas. - : Zenodo, 2019
BASE
Show details
13
RUEG Corpus ...
BASE
Show details
14
korpling/ANNIS beta.3 ...
BASE
Show details
15
Die Hard 1.1024.0: backward compatibility of a search engine with persistant Ids ... : subtitle of the resource ...
Krause, Thomas; Druskat, Stephan. - : Gesellschaft für Informatik e.V. (GI), 2019
BASE
Show details
16
ANNIS: A graph-based query system for deeply annotated text corpora
Krause, Thomas. - : Humboldt-Universität zu Berlin, 2019
Abstract: Diese Dissertation beschreibt das Design und die Implementierung eines effizienten Suchsystems für linguistische Korpora. Das bestehende und auf einer relationalen Datenbank basierende System ANNIS ist spezialisiert darin, Korpora mit verschiedenen Arten von Annotationen zu unterstützen und nutzt Graphen als einheitliche Repräsentation der verschiedener Annotationen. Für diese Dissertation wurde eine Hauptspeicher-Datenbank, die rein auf Graphen basiert, als Nachfolger für ANNIS entwickelt. Die Korpora werden in Kantenkomponenten partitioniert und für verschiedene Typen von Subgraphen werden unterschiedliche Implementationen zur Darstellung und Suche in diesen Komponenten genutzt. Operationen der Anfragesprache AQL (ANNIS Query Language) werden als Kombination von Erreichbarkeitsanfragen auf diesen verschiedenen Komponenten implementiert und jede Implementierung hat optimierte Funktionen für diese Art von Anfragen. Dieser Ansatz nutzt die verschiedenen Strukturen der unterschiedlichen Annotationsarten aus, ohne die einheitliche Darstellung als Graph zu verlieren. Zusätzliche Optimierungen, wie die parallele Ausführung von Teilen der Anfragen, wurden ebenfalls implementiert und evaluiert. Da AQL eine bestehende Implementierung besitzt und diese für Forscher offen als webbasierter Service zu Verfügung steht, konnten echte AQL-Anfragen aufgenommen werden. Diese dienten als Grundlage für einen Benchmark der neuen Implementierung. Mehr als 4000 Anfragen über 18 Korpora wurden zu einem realistischen Workload zusammengetragen, der sehr unterschiedliche Arten von Korpora und Anfragen mit einem breitem Spektrum von Komplexität enthält. Die neue graphbasierte Implementierung wurde mit der existierenden, die eine relationale Datenbank nutzt, verglichen. Sie führt den Anfragen im Workload im Vergleich ~10 schneller aus und die Experimente zeigen auch, dass die verschiedenen Implementierungen für die Kantenkomponenten daran einen großen Anteil haben. ; This dissertation describes the design and implementation of an efficient system for linguistic corpus queries. The existing system ANNIS is based on a relational database and is focused on providing support for corpora with very different kinds of annotations and uses graphs as unified representations of the different annotations. For this dissertation, a main memory and solely graph-based successor of ANNIS has been developed. Corpora are divided into edge components and different implementations for representation and search of these components are used for different types of subgraphs. AQL operations are interpreted as a set of reachability queries on the different components and each component implementation has optimized functions for this type of queries. This approach allows exploiting the different structures of the different kinds of annotations without losing the common representation as a graph. Additional optimizations, like parallel executions of parts of the query, are also implemented and evaluated. Since AQL has an existing implementation and is already provided as a web-based service for researchers, real-life AQL queries have been recorded and thus can be used as a base for benchmarking the new implementation. More than 4000 queries from 18 corpora (from which most are available under an open-access license) have been compiled into a realistic workload that includes very different types of corpora and queries with a wide range of complexity. The new graph-based implementation was compared against the existing one, which uses a relational database. It executes the workload ~10 faster than the baseline and experiments show that the different graph storage implementations had a major effect in this improvement.
Keyword: 004 Datenverarbeitung; Corpus linguistics; ddc:004; Graph database; Graphdatenbank; Hauptspeicher-Datenbank; In-memory database; Informatik; Korpuslinguistik; Search engine; ST 306; Suchmaschine
URN: urn:nbn:de:kobv:11-110-18452/20436-5
URL: https://doi.org/10.18452/19659
http://edoc.hu-berlin.de/18452/20436
BASE
Hide details
17
Thomaskrause/Graphannis Untagged-Cdab3A5A0D1C82968D33 ...
Krause, Thomas. - : Zenodo, 2018
BASE
Show details
18
Thomaskrause/Graphannis Untagged-8F4B1Fb26Bf825Ec5286 ...
Krause, Thomas. - : Zenodo, 2018
BASE
Show details
19
Korpling/Annis Annis-3.5.0-Preview6 ...
BASE
Show details
20
Korpling/Annis Annis-3.5.0-Rc ...
BASE
Show details

Page: 1 2 3

Catalogues
0
0
0
0
1
0
0
Bibliographies
0
0
0
0
0
0
0
0
0
Linked Open Data catalogues
0
Online resources
0
0
0
0
Open access documents
40
0
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern