DE eng

Search in the Catalogues and Directories

Page: 1 2
Hits 1 – 20 of 24

1
Dygitalizacja i komputeryzacja słowników na przykładzie Słownika polszczyzny XVI wieku
Bień, Janusz S.. - : Instytut Języka Polskiego PAN i Wydawnictwo LEXIS, 2010
BASE
Show details
2
Dygitalizacja i komputeryzacja słowników na przykładzie Słownika polszczyzny XVI wieku
Bień, Janusz S.. - : Instytut Języka Polskiego PAN i Wydawnictwo LEXIS, 2010
BASE
Show details
3
Functional Class (so Called "Part of Speech") Assignment as a Kind of Meaning-Bound Word Syntactic Information
Wajszczuk, Jadwiga. - : Slawistyczny Ośrodek Wydawniczy, 2010
BASE
Show details
4
Dygitalizacja i komputeryzacja słowników na przykładzie Słownika polszczyzny XVI wieku
BASE
Show details
5
Problemy formalnego opisu składni polskiej
Bień, Janusz S.. - : BEL Studio, 2009
BASE
Show details
6
Digitalizing dictionaries of Polish
Bień, Janusz S.. - : Wydawnictwo Uniwersytetu w Białymstoku, 2009
BASE
Show details
7
Facilitating access to digitalized dictionaries
BASE
Show details
8
Dygitalizacja i komputeryzacja słowników na przykładzie Słownika polszczyzny XVI wieku
BASE
Show details
9
Facilitating access to digitalized dictionaries in DjVu format
Bień, Janusz S.. - : Slawistyczny Ośrodek Wydawniczy, 2009
BASE
Show details
10
Facilitating access to digitalized dictionaries in DjVu format
Abstract: One of the best formats for scanned documents is DjVu. An essential feature of the format is the hidden text layer, usually containing the results of Optical Character Recognition. Another important feature is the ability to store (and serve over Internet) the documents as a collection of individual pages. From the very beginning it has been used also for dictionaries, in particular there are also several Polish dictionaries available in this format. So the question is how to search efficiently the text layer in such large multi-volume works. For this purpose we intend to adapt Poliqarp (Polyinterpretation Indexing Query and Retrieval Procesor), a GPLed corpus query tool developed in the Institute of Computer Science of Polish Academy of Sciences. Some preliminary experiments are described in the talk. In our ,,quick and dirty'' approach we treat every page as a single document with the metadata consisting of the name of the document index and the name of the file with the page content. For every word, instead of grammatical tags, we provide its localization on the page in the form of the line number and its position in the line. All the data taken together allow to link the search results to the appropriate fragments of the original scans.
Keyword: Albanian languages and literature; Baltic; P Philology. Linguistics; PG Slavic; QA75 Electronic computers. Computer science; QA76 Computer software; Z004 Books. Writing. Paleography; ZA4050 Electronic information resources
URL: https://bc.klf.uw.edu.pl/118/1/JSB_DL-09s.pdf
https://bc.klf.uw.edu.pl/118/2/JSB_DL-09.pdf
http://www.ispan.waw.pl/images/konferencje/mondilex%20conference%20warsaw%202009.pdf
https://bc.klf.uw.edu.pl/118/
BASE
Hide details
11
Towards linguistic analysis of computer messages in Polish and English
Bień, Janusz S.; Bilińska, Joanna A.; Moszczyński, Radosław. - : Slawistyczny Ośrodek Wydawniczy, 2008
BASE
Show details
12
Digitalizing dictionaries of Polish
BASE
Show details
13
An Approach to Computational Morphology
Bień, Janusz S.. - : Springer, 2004
BASE
Show details
14
Posłowie redaktora
Bień, Janusz S.. - : Instytut Informatyki Uniwersytetu Warszawskiego, 1999
BASE
Show details
15
Posłowie redaktora
Bień, Janusz S.. - : Instytut Informatyki Uniwersytetu Warszawskiego, 1999
BASE
Show details
16
Processing Polish with metamorphosis grammars
BASE
Show details
17
Koncepcja słownikowej informacji morfologicznej i jej komputerowej weryfikacji
Bień, Janusz S.. - : Wydawnictwa Uniwersytetu Warszawskiego, 1991
BASE
Show details
18
Z problemów maszynowego przetwarzania tekstów polskich. Zmodyfikowana notacja Tokarskiego
Bień, Janusz S.. - : Państwowe Wydawnictwo Naukowe, 1983
BASE
Show details
19
Toward computational description of written Polish
Bień, Janusz S.; Szpakowicz, Stanisław. - : Association for Computing Machinery, 1982
BASE
Show details
20
Toward Computational Description of Written Polish
Bień, Janusz S.; Szpakowicz, Stanisław. - : Instytut Informatyki Uniwersytetu Warszawskiego, 1981
BASE
Show details

Page: 1 2

Catalogues
0
0
0
0
0
0
0
Bibliographies
0
0
0
0
0
0
0
0
0
Linked Open Data catalogues
0
Online resources
0
0
0
0
Open access documents
24
0
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern