DE eng

Search in the Catalogues and Directories

Hits 1 – 3 of 3

1
Zentrum und Peripherie der Fehlertoleranz : zum Scheitern internationaler Kommunikation
In: Zentrum und Peripherie <Veranstaltung, 2016, Opava>. Zentrum und Peripherie. - Opava : Slezská Univerzita v Opavě (2017), 69-83
UB Frankfurt Linguistik
Show details
2
Efficient error-tolerant search on large text collections ; Effiziente fehlertolerante Suche auf große Datenmengen
Celikik, Marjan. - : Albert-Ludwigs-Universität Freiburg, 2013
Abstract: In this dissertation, we consider the problem of fuzzy full-text search and query suggestion in large text collections, that is, full-text search that is robust against errors on the side of the query as well as errors on the side of the documents. We consider two variants of the problem. The first variant is keyword-based search tolerant to errors. The second variant is autocompletion or prefix search tolerant to errors. In this variant of the problem, each keyword can be specified partially and the results appear instantly as the user types the query letter by letter. One of the main challenges in building an information retrieval system for fuzzy search is e ciency. Providing interactive query times (below 100 ms) for either fuzzy search variant is surprisingly challenging due to the one order of magnitude larger volume of data to be handled by the system. While e cient index data structures exist that allow fast search for the exact variants of the problem, there has been limited work on indexes that tackle fuzzy search. Commercial search engines such as Yahoo!, Google and Bing provide error-tolerance to certain extent thanks to the large amount of available query log data. In our version of the problem, we assume a complete absence of query logs or any other precomputed information. This assumption is often realistic for information retrieval systems for vertical or domain-specific search that typically have a much smaller user base. In the first part of this dissertation, we propose e cient data structures and algorithms that are the core of our fuzzy search. In the second part, we address important algorithm-engineering aspects of an error-tolerant search system. All of our algorithms and data structures have been implemented and integrated into the CompleteSearch engine. ; Der Beitrag dieser Dissertation besteht aus zwei Teilen. Der erste Teil befasst sich mit e zienten Datenstrukturen und Algorithmen die der Kern unserer fuzzy-Suche sind. Der zweite Teil behandelt wichtige technische Aspekte von einer fehlertoleranten Suchmaschine. Alle unsere Algorithmen und Datenstrukturen wurden in die CompleteSearch Suchmaschine Bast and Weber [2006], welche Ergebnisse und Vorschläge liefert während man tippt, implementiert. Nach dem Formalisieren von jedem Problem präsentieren wir e ziente Wortabgleichungsalgorithmen, welche Fehler erlauben (auch bekannt als approximative Lexikonsuche), gefolgt von e zienten Präfixabgleichungsalgorithmen die Fehler erlauben (auch bekannt als fehlertolerante Autovervollständigung). Diese zwei Probleme sind Voraussetzungen für das zentrale Problem welches in dieser Dissertation betrachtet wird, nämlich Indexe für e ziente fuzzy-Schlüsselwortbasierte- und Autovervollständigungssuche. Dann betrachten wir das Problem von Suchanfragevorschlägen in Abwesenheit von Suchanfrageaufzeichnungen. Die zwei abschließend betrachteten Probleme sind e ziente Indexkonstruktion, gefolgt von e zienter Ergebnisauszuggenerierung für fuzzy-Suche.
Keyword: Datenanalyse; Fehlertoleranz; Fuzzy-Logik; Online-Ressource
URL: https://freidok.uni-freiburg.de/data/9179
https://www.freidok.uni-freiburg.de/dnb/download/9179
http://nbn-resolving.de/urn:nbn:de:bsz:25-opus-91796
BASE
Hide details
3
Robustes chunkparsing mit variabler Analysetiefe [Online resource]
In: http://jones.ling.indiana.edu/~skuebler/papers/konvens00.ps ; KONVENS 2000 / Sprachkommunikation, Ilmenau, Oktober 2000. (2000)
Linguistik-Repository
Show details

Catalogues
1
0
0
0
0
0
0
Bibliographies
0
0
0
0
0
0
0
0
0
Linked Open Data catalogues
0
Online resources
0
0
0
0
Open access documents
1
1
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern