DE eng

Search in the Catalogues and Directories

Hits 1 – 2 of 2

1
多重の読みを持つテキストのコーパス化
In: http://pj.ninjal.ac.jp/corpus_center/lrw2016.html (2017)
Abstract: 会議名: 言語資源活用ワークショップ2016, 開催地: 国立国語研究所, 会期: 2017年3月7日-8日, 主催: 国立国語研究所 コーパス開発センター ; 日本語のテキストには,本文漢字の通常の読みを示すのではない特殊な読みをもつ振り仮名(たとえば「強敵」と書いて「とも」とふりがなを振る類)や,掛詞(「ながめ」を「眺め」「長雨」の両用に読む類から,語形の一部から別の語を連想させる類まで),各種の洒落など,意図的に多重の読みを持たされたテキストが少なくない。従来のコーパスではこのような多重の読みは切り捨てられ,選択されたただ一つの読みを配置することが多かった。本発表では,このような多重の読みを持つテキストについて,主として『日本語歴史コーパス』の事例を整理して示すとともに,そのあるべきコーパスアノテーションの方法について論じる。
Keyword: Balanced Corpus of Contemporary Written Japanese (BCCWJ); Corpus of Historical Japanese (CHJ); 日本語歴史コーパス(CHJ); 現代日本語書き言葉均衡コーパス(BCCWJ)
URL: http://id.nii.ac.jp/1328/00001470/
https://repository.ninjal.ac.jp/?action=repository_uri&item_id=1486
https://repository.ninjal.ac.jp/?action=repository_action_common_download&item_id=1486&item_no=1&attribute_id=48&file_no=1
BASE
Hide details
2
日本語コーパスの包括的検索環境の実現に向けて
In: http://pj.ninjal.ac.jp/corpus_center/lrw2016.html (2017)
BASE
Show details

Catalogues
0
0
0
0
0
0
0
Bibliographies
0
0
0
0
0
0
0
0
0
Linked Open Data catalogues
0
Online resources
0
0
0
0
Open access documents
2
0
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern