Home Catalogue search

eng

Refine your search:
- Keyword:
- Creator / Publisher
- Year:
  - 2021 (1)
  - 2019 (6)
  - 2018 (3)
  - 2017 (10)
  - 2016 (1)
  - 2015 (1)
- Medium
- Type
- BLLDB-Access:
  - free (22)
  - subject to license (0)

Search in the Catalogues and Directories






	Sort by
Simple Search

Page: 1 2

Hits 1 – 20 of 22

1	Training corpus ssj500k 2.3
	Krek, Simon; Dobrovoljc, Kaja; Erjavec, Tomaž. - : Centre for Language Resources and Technologies, University of Ljubljana, 2021
	BASE
	Show details

2	Training corpus ssj500k 2.2
	Krek, Simon; Dobrovoljc, Kaja; Erjavec, Tomaž. - : Centre for Language Resources and Technologies, University of Ljubljana, 2019
	BASE
	Show details

3	Slovenian parliamentary corpus ParlaMeter-sl 1.0
	Dobranić, Filip; Ljubešić, Nikola; Erjavec, Tomaž. - : Jožef Stefan Institute, 2019
	BASE
	Show details

4	Croatian Twitter training corpus ReLDI-NormTagNER-hr 2.1
	Ljubešić, Nikola; Erjavec, Tomaž; Batanović, Vuk; Miličević, Maja; Samardžić, Tanja. - : Jožef Stefan Institute, 2019
	Abstract: ReLDI-NormTagNER-hr 2.1 is a manually annotated corpus of Croatian tweets. It is meant as a gold-standard training and testing dataset for tokenisation, sentence segmentation, word normalisation, morphosyntactic tagging, lemmatisation and named entity recognition of non-standard Croatian. Each tweet is also annotated for its automatically assigned standardness levels (T = technical standardness, L = linguistic standardness). As an update to version 2.0, version 2.1 corrects some annotation errors and adds morphosyntactic annotations in the Universal Dependencies formalism in addition to the MULTEXT-East morphosyntactic descriptions. The corpus is now also available in CoNLL-U format.
	Keyword: computer-mediated communication; lemmatisation; manual annotation; named entities; part-of-speech tagging; TEI; tokenisation; word normalisation
	URL: http://hdl.handle.net/11356/1241
	BASE
	Hide details

5	CMC training corpus Janes-Tag 2.1
	Erjavec, Tomaž; Fišer, Darja; Čibej, Jaka. - : Jožef Stefan Institute, 2019
	BASE
	Show details

6	Croatian parliamentary corpus ParlaMeter-hr 1.0
	Dobranić, Filip; Ljubešić, Nikola; Erjavec, Tomaž. - : Jožef Stefan Institute, 2019
	BASE
	Show details

7	Serbian Twitter training corpus ReLDI-NormTagNER-sr 2.1
	Ljubešić, Nikola; Erjavec, Tomaž; Batanović, Vuk. - : Jožef Stefan Institute, 2019
	BASE
	Show details

8	Training corpus SETimes.SR 1.0
	Batanović, Vuk; Ljubešić, Nikola; Samardžić, Tanja. - : Regional Linguistic Data Initiative Centre ReLDI, 2018
	BASE
	Show details

9	Training corpus ssj500k 2.1
	Krek, Simon; Dobrovoljc, Kaja; Erjavec, Tomaž. - : Centre for Language Resources and Technologies, University of Ljubljana, 2018
	BASE
	Show details

10	Training corpus hr500k 1.0
	Ljubešić, Nikola; Agić, Željko; Klubička, Filip. - : Jožef Stefan Institute, 2018
	BASE
	Show details

11	ReLDI token+tag+lemma+NER web service for WebLicht
	Ljubešić, Nikola; Perovšek, Matic; Erjavec, Tomaž. - : Jožef Stefan Institute, 2017
	BASE
	Show details

12	CMC training corpus Janes-Tag 2.0
	Erjavec, Tomaž; Fišer, Darja; Čibej, Jaka. - : Jožef Stefan Institute, 2017
	BASE
	Show details

13	Serbian Twitter training corpus ReLDI-NormTagNER-sr 2.0
	Ljubešić, Nikola; Erjavec, Tomaž; Miličević, Maja. - : Jožef Stefan Institute, 2017
	BASE
	Show details

14	Wikipedia talk corpus Janes-Wiki 1.0
	Ljubešić, Nikola; Erjavec, Tomaž; Fišer, Darja. - : Jožef Stefan Institute, 2017
	BASE
	Show details

15	Training corpus ssj500k 2.0
	Krek, Simon; Dobrovoljc, Kaja; Erjavec, Tomaž. - : Centre for Language Resources and Technologies, University of Ljubljana, 2017
	BASE
	Show details

16	News comment corpus Janes-News 1.0
	Erjavec, Tomaž; Ljubešić, Nikola; Fišer, Darja. - : Jožef Stefan Institute, 2017
	BASE
	Show details

17	Croatian Twitter training corpus ReLDI-NormTagNER-hr 2.0
	Ljubešić, Nikola; Erjavec, Tomaž; Miličević, Maja. - : Jožef Stefan Institute, 2017
	BASE
	Show details

18	Blog post and comment corpus Janes-Blog 1.0
	Erjavec, Tomaž; Ljubešić, Nikola; Fišer, Darja. - : Jožef Stefan Institute, 2017
	BASE
	Show details

19	Forum corpus Janes-Forum 1.0
	Erjavec, Tomaž; Ljubešić, Nikola; Fišer, Darja. - : Jožef Stefan Institute, 2017
	BASE
	Show details

20	Twitter corpus Janes-Tweet 1.0
	Ljubešić, Nikola; Erjavec, Tomaž; Fišer, Darja. - : Jožef Stefan Institute, 2017
	BASE
	Show details

Page: 1 2

© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern