DE eng

Search in the Catalogues and Directories

Page: 1 2 3
Hits 1 – 20 of 46

1
『現代日本語書き言葉均衡コーパス』出版書籍サンプルのNDC別語彙分布
In: https://ccd.ninjal.ac.jp/lrw2021.html (2021)
BASE
Show details
2
日本語言語資源の包括的高度利用環境の整備
In: https://www2.ninjal.ac.jp/openhouse/2018/ (2021)
BASE
Show details
3
編集後記
In: https://ccd.ninjal.ac.jp/lrw2021.html (2021)
BASE
Show details
4
『分類語彙表』に対する単語親密度付与
In: https://www2.ninjal.ac.jp/openhouse/2019/ (2021)
BASE
Show details
5
日本語言語資源の包括的高度利用環境の整備
In: https://www2.ninjal.ac.jp/openhouse/2019/ (2021)
BASE
Show details
6
『分類語彙表』に対する反対語情報付与
加藤 祥; 浅原 正幸; 森山 奈々美. - : 言語処理学会, 2021
BASE
Show details
7
テキストの読みやすさについて
In: https://www2.ninjal.ac.jp/openhouse/2018/ (2021)
BASE
Show details
8
『現代日本語書き言葉均衡コーパス』新聞記事情報を用いたジャンル別語彙分布
In: https://ccd.ninjal.ac.jp/lrw2021.html (2021)
BASE
Show details
9
『現代日本語書き言葉均衡コーパス』書籍サンプルのNDC情報増補 : NDC情報を用いた随筆の抽出と文体調査
Abstract: 目白大学 ; 国立国語研究所 コーパス開発センター 技術補佐員 ; 国立国語研究所 コーパス開発センター ; Mejiro University ; Technical Staff, Center for Corpus Development, NINJAL ; Center for Corpus Development, NINJAL ; 本研究では『現代日本語書き言葉均衡コーパス』(BCCWJ)の書籍全サンプル22,058サンプル(PB(出版)10,117サンプル・LB(図書館)10,551サンプル・OB(ベストセラー)1,390サンプル)に付与された日本十進分類法(NDC)分類記号の補助分類を拡張した。作業は,国立国会図書館サーチのNDC情報を参照し,人手によって分類の確認と追加を行った。また,開発当時NDC分類記号が付与されていなかったサンプル(「分類なし」)などの見直しもあわせて行った。本作業結果により,たとえば形式区分を利用し,ジャンルの分散する「随筆(-049)」「理論(-01)」「教科書(-078)」などのカテゴリでBCCWJサンプルを分類することが可能となった。このほか,時代情報や小項目が追加されたサンプルもあり,今まで以上に詳細な分類が可能となった。本研究では,情報付与作業の方法と基礎情報を報告し,分類例を示す。本データを用いた研究事例として,NDC情報を用いた随筆の抽出と随筆の文体調査結果を報告する。本データは「中納言」の検索で利用できる。 ; This study presents the enlargement of Nippon Decimal Classification (NDC) metadata of book samples in the "Balanced Corpus of Contemporary Written Japanese (BCCWJ)." We revised and enhanced the NDC information about all of the book samples from the BCCWJ (22,058 samples) comprising PB (books in the publication subcorpus: 10,117 samples), LB (books in library subcorpus: 10,551 samples), and OB (books in the special-purpose subcorpus; namely, best sellers: 1,390 samples). We referred to the NDC information using the National Diet Library Search API and manually re-annotated the NDC information. In addition, we completed the empty entries of the original BCCWJ metadata. Based on these procedures, we were able to classify the BCCWJ book samples according to the genres of essay (-049), theory (-01), and textbook (-078) with the NDC supplemental tables. Furthermore, since finer-grained categories, including their chronological periods, were added to some samples, users can explore a more detailed classification of the book samples. We present the methodology of NDC information enlargement and its basic statistics. We also present experimental research on extraction essays from books and the investigation of their writing style. The compiled data can be used in the corpus query systems of "Chunagon."
Keyword: log-likelihood ratio; Nippon Decimal Classification; writing style; “Balanced Corpus of Contemporary Written Japanese”; 『現代日本語書き言葉均衡コーパス』; 対数尤度比; 文体; 日本十進分類法
URL: https://repository.ninjal.ac.jp/?action=repository_uri&item_id=3454
http://id.nii.ac.jp/1328/00003437/
https://repository.ninjal.ac.jp/?action=repository_action_common_download&item_id=3454&item_no=1&attribute_id=54&file_no=1
BASE
Hide details
10
分類語彙表に対する単語親密度情報付与
In: https://www2.ninjal.ac.jp/openhouse/2020/ (2021)
BASE
Show details
11
自然言語処理 : 言語資源・意味解析(レクチャーシリーズ「人工知能の今」第6回)
In: https://www.ai-gakkai.or.jp/vol35_no1/ (2020)
BASE
Show details
12
日本語における名詞句の情報構造と語順の相関についての統計的検討
宮内 拓也; 浅原 正幸; Takuya Miyauchi. - : 言語処理学会, 2020
BASE
Show details
13
編集後記
In: https://pj.ninjal.ac.jp/corpus_center/lrw2020.html (2020)
BASE
Show details
14
Bayesian Linear Mixed Model による単語親密度推定と位相情報付与
浅原 正幸; Masayuki Asahara. - : 言語処理学会, 2020
BASE
Show details
15
『現代日本語書き言葉均衡コーパス』に基づく指標比喩データベース
加藤 祥; 菊地 礼; 浅原 正幸. - : 言語処理学会, 2020
BASE
Show details
16
日本語の読み時間と節境界情報 : 主辞後置言語における wrap-up effect の検証
浅原 正幸; Masayuki Asahara. - : 言語処理学会, 2019
BASE
Show details
17
概念辞書の類義語と分散表現を利用した教師なし all-words WSD
鈴木 類; 古宮 嘉那子; 浅原 正幸. - : 言語処理学会, 2019
BASE
Show details
18
分類語彙表番号を付与した『現代日本語書き言葉均衡コーパス』の書籍・新聞・雑誌データ
加藤 祥; 浅原 正幸; 山崎 誠. - : 日本語学会, 2019
BASE
Show details
19
読み時間と統語・意味分類
浅原 正幸; 加藤 祥; Masayuki Asahara. - : 日本認知科学会, 2019
BASE
Show details
20
『分類語彙表』と『岩波国語辞典第五版タグ付きコーパス2004』の対応表
In: https://pj.ninjal.ac.jp/corpus_center/lrw2019.html (2019)
BASE
Show details

Page: 1 2 3

Catalogues
0
0
0
0
0
0
0
Bibliographies
0
0
0
0
0
0
0
0
0
Linked Open Data catalogues
0
Online resources
0
0
0
0
Open access documents
46
0
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern