3 |
コーパスで日本語の歴史を探る : 「通時コーパス」プロジェクトの取り組み
|
|
|
|
In: https://www2.ninjal.ac.jp/openhouse/2019/ (2021)
|
|
BASE
|
|
Show details
|
|
4 |
コーパスを使った日本語の歴史の研究
|
|
|
|
In: https://www2.ninjal.ac.jp/openhouse/2018/ (2021)
|
|
BASE
|
|
Show details
|
|
5 |
『日本語歴史コーパス』の紹介
|
|
|
|
In: https://www2.ninjal.ac.jp/openhouse/2020/ (2021)
|
|
BASE
|
|
Show details
|
|
6 |
多重の読みを持つ宣命コーパスの構築
|
|
|
|
In: http://id.nii.ac.jp/1001/00208605/ (2020)
|
|
BASE
|
|
Show details
|
|
7 |
近代の歴史的資料を対象とした機械学習による文境界推定
|
|
|
|
In: http://id.nii.ac.jp/1001/00203040/ (2020)
|
|
BASE
|
|
Show details
|
|
8 |
「人情本コーパス」の設計と構築
|
|
|
|
Abstract:
国立国語研究所 研究系 言語変化研究領域 ; 東京大学大学院人文社会系研究科 博士課程 ; 常葉大学 ; 千葉大学 ; 国立国語研究所 研究系 言語変化研究領域 ; 国立国語研究所 研究系 言語変化研究領域 ; Language Change Division, Research Department, NINJAL ; Graduate Student, Humanities and Sociology, The University of Tokyo ; Tokoha University ; Chiba University ; Language Change Division, Research Department, NINJAL ; Language Change Division, Research Department, NINJAL ; 現在,『日本語歴史コーパス』「江戸時代編」の一環として「人情本コーパス」を構築中である。2015年10月には『比翼連理花廼志満台』を対象とした「人情本コーパス」の試行版(全文検索システム『ひまわり』版)を公開した。人情本のコーパス化は,(1)原本表記に忠実な翻字テキストの作成,(2)(1)に最小限の校訂を加えた『ひまわり』版XMLテキストの作成の段階である。XMLテキストの作成では,基本的に「洒落本コーパス」のタグセットに準拠し,合字や校訂にかかわるタグを追加した人情本用タグセットを用意した。また,『花廼志満台』初編上巻の形態素解析を行った結果,解析精度は約87%であった。人情本に特徴的なイレギュラーな訓の多さが,精度の低さと関係している。今後,形態論情報付きコーパスを構築するにあたっての課題は,イレギュラーな訓を含む漢字に振られた「ルビ」を,どのように扱っていくかである。 ; The Ninjobon Corpus is currently under construction as a part of the Edo Period Collection of the Corpus of Historical Japanese. In October 2015, a trial version of the Ninjobon Corpus (full text search system in the Himawari edition) focusing on the Hiyokurenri Hana no Shimadai was publicly released. The Ninjobon Corpus creation is at the stage of (1) faithful transcription of the original printed book into text, and (2) creation of the "Himawari" XML texts with minimal revisions to (1). In the creation of the XML texts, the tag set is fundamentally based on the Sharebon Corpus, though a tag set with tags related to ligatures and revisions was prepared for the Ninjobon. Further, the results of a morphological analysis of the first volume of Hana no Shimadai showed an analytical precision of approximately 87%. The low precision is caused by the large number of characteristically irregular readings in the Ninjobon. One challenge in a corpus construction with annotated morphological information is on how to address the "rubies" attached to kanji characters with irregular native Japanese readings.
|
|
Keyword:
Corpus of Historical Japanese; Hana-no-Shimadai; Ninjobon Corpus; 『比翼連理花廼志満台』; 人情本コーパス; 日本語歴史コーパス
|
|
URL: http://id.nii.ac.jp/1328/00000850/ https://repository.ninjal.ac.jp/?action=repository_action_common_download&item_id=866&item_no=1&attribute_id=54&file_no=1 https://repository.ninjal.ac.jp/?action=repository_uri&item_id=866
|
|
BASE
|
|
Hide details
|
|
9 |
多重の読みを持つテキストのコーパス化
|
|
|
|
In: http://pj.ninjal.ac.jp/corpus_center/lrw2016.html (2017)
|
|
BASE
|
|
Show details
|
|
10 |
『日本語歴史コーパス』における原文KWIC表示機能の実装
|
|
|
|
In: http://pj.ninjal.ac.jp/corpus_center/lrw2017.html (2017)
|
|
BASE
|
|
Show details
|
|
11 |
日本語コーパスの包括的検索環境の実現に向けて
|
|
|
|
In: http://pj.ninjal.ac.jp/corpus_center/lrw2016.html (2017)
|
|
BASE
|
|
Show details
|
|
15 |
〈共同研究プロジェクト紹介〉萌芽・発掘型 : 統計と機械学習による日本語史研究 歴史的日本語資料のアノテーションと自動濁点付与
|
|
|
|
BASE
|
|
Show details
|
|
|
|