DE eng

Search in the Catalogues and Directories

Page: 1 2
Hits 1 – 20 of 21

1
『現代日本語書き言葉均衡コーパス』出版書籍サンプルのNDC別語彙分布
In: https://ccd.ninjal.ac.jp/lrw2021.html (2021)
BASE
Show details
2
『分類語彙表』に対する反対語情報付与
加藤 祥; 浅原 正幸; 森山 奈々美. - : 言語処理学会, 2021
BASE
Show details
3
『現代日本語書き言葉均衡コーパス』新聞記事情報を用いたジャンル別語彙分布
In: https://ccd.ninjal.ac.jp/lrw2021.html (2021)
BASE
Show details
4
『現代日本語書き言葉均衡コーパス』書籍サンプルのNDC情報増補 : NDC情報を用いた随筆の抽出と文体調査
加藤 祥; 森山 奈々美; 浅原 正幸. - : 国立国語研究所, 2021
BASE
Show details
5
『現代日本語書き言葉均衡コーパス』への意味情報(分類語彙表番号と助動詞用法)付与
In: https://www2.ninjal.ac.jp/openhouse/2020/ (2021)
BASE
Show details
6
『現代日本語書き言葉均衡コーパス』に基づく指標比喩データベース
加藤 祥; 菊地 礼; 浅原 正幸. - : 言語処理学会, 2020
BASE
Show details
7
分類語彙表番号を付与した『現代日本語書き言葉均衡コーパス』の書籍・新聞・雑誌データ
加藤 祥; 浅原 正幸; 山崎 誠. - : 日本語学会, 2019
BASE
Show details
8
読み時間と統語・意味分類
浅原 正幸; 加藤 祥; Masayuki Asahara. - : 日本認知科学会, 2019
BASE
Show details
9
『分類語彙表』と『岩波国語辞典第五版タグ付きコーパス2004』の対応表
In: https://pj.ninjal.ac.jp/corpus_center/lrw2019.html (2019)
BASE
Show details
10
『現代日本語書き言葉均衡コーパス』書籍サンプルのNDC情報増補
In: https://pj.ninjal.ac.jp/corpus_center/lrw2019.html (2019)
BASE
Show details
11
特徴的な要素と用例頻度の関係 : 角を例とした一考察
加藤 祥; Sachi KATO. - : 国立国語研究所, 2018
BASE
Show details
12
『現代日本語書き言葉均衡コーパス』への情報構造アノテーションとその分析
宮内 拓也; 浅原 正幸; 中川 奈津子. - : 国立国語研究所, 2018
BASE
Show details
13
テキストからの対象物認識に有用な情報提示順序 : 動物の説明文を用いた調査例
加藤 祥; Sachi KATO. - : 国立国語研究所, 2018
BASE
Show details
14
『現代日本語書き言葉均衡コーパス』書籍サンプルに対するNDC記号拡張アノテーションとNDC形式区分を用いた「随筆」の文体分析
In: https://pj.ninjal.ac.jp/corpus_center/lrw2018.html (2018)
BASE
Show details
15
『現代日本語書き言葉均衡コーパス』への情報構造アノテーションの分析
In: http://pj.ninjal.ac.jp/corpus_center/lrw2016.html (2017)
BASE
Show details
16
分類語彙表番号を用いた比喩表現収集の試み
In: http://pj.ninjal.ac.jp/corpus_center/lrw2017.html (2017)
BASE
Show details
17
『現代日本語書き言葉均衡コーパス』に対する分類語彙表番号アノテーションの試行
In: http://pj.ninjal.ac.jp/corpus_center/lrw2016.html (2017)
BASE
Show details
18
テキストからの対象物認識に有用な記述内容 : 動物を例に
加藤 祥; Sachi KATO. - : 国立国語研究所, 2015
BASE
Show details
19
『現代日本語書き言葉均衡コーパス』の文境界修正
Abstract: 国立国語研究所 コーパス開発センター 非常勤研究員 ; マンパワーグループ株式会社 ; 国立国語研究所 理論・構造研究系 非常勤研究員 ; 国立国語研究所 コーパス開発センター 非常勤研究員 ; 国立国語研究所 言語資源研究系 ; 国立国語研究所 コーパス開発センター 技術補佐員(元) ; 国立国語研究所 コーパス開発センター プロジェクト研究員 ; 文部科学省 ; 国立国語研究所 言語資源研究系 ; 国立国語研究所 言語資源研究系 ; 国立国語研究所 言語資源研究系 ; 国立国語研究所 言語資源研究系 ; 国立国語研究所 言語資源研究系 ; Adjunct Researcher, Center for Corpus Development, NINJAL ; Manpower Group Co., Ltd ; Adjunct Researcher, Department of Linguistic Theory and Structure, NINJAL ; Adjunct Researcher, Center for Corpus Development, NINJAL ; Department of Corpus Studies, NINJAL ; (former) Technical Staff, Center for Corpus Development, NINJAL ; Postdoctoral Research Fellow, Center for Corpus Development, NINJAL ; Ministry of Education, Culture, Sports, Science, and Technology ; Department of Corpus Studies, NINJAL ; Department of Corpus Studies, NINJAL ; Department of Corpus Studies, NINJAL ; Department of Corpus Studies, NINJAL ; Department of Corpus Studies, NINJAL ; 『現代日本語書き言葉均衡コーパス』第1.0版(Maekawa et al. 2014)(以下BCCWJ)には「文境界」の情報がアノテーションされているが,その認定基準の妥当性について従来から様々な指摘がある(小西ほか2014,長谷川2014,田野村2014)。この問題に対処するために,国立国語研究所コーパス開発センターでは2013年から2014年にかけて,BCCWJの修正を行った。本稿ではその修正作業について報告する。第1.0版におけるBCCWJ 文境界情報の問題は,コーパス構築の過程において文境界を含む文書構造タグの整備と形態素列レベルの情報の整備とを並行して行ったために,文字情報を用いる文境界処理にとどまったことに由来する。今回,形態論情報に基づいた文境界基準を策定し,問題の解消を試みた。文境界修正の指針を示すとともに,文境界修正に用いた作業環境と,修正件数について報告する。 ; In December 2011, the National Institute for Japanese Language and Linguistics (NINJAL) released a 100-million-word balanced corpus - the Balanced Corpus of Contemporary Written Japanese (BCCWJ) DVD Version 1.0 - which was compiled from 2006 through 2011. Some users have pointed out some issues concerning sentence delimitation in the BCCWJ. To address these issues, we - NINJAL - performed a complete survey and correction, beginning in 2013 and ending in 2014. This article reports the revision work on sentence delimitation in the BCCWJ. The problems with the BCCWJ DVD Version 1.0 derive from the string-based definition. We could not obtain any morpheme information for the sentence delimitation task because of the task parallelism between sentence delimitation annotation and morpheme annotation. The method used this time was morpheme based. We present the morpheme-based annotation guidelines, annotation environment, and basic statistics of the corpus correction.
Keyword: annotation; BCCWJ; error correction environment; error correction standard; sentence boundary; アノテーション; 修正基準; 修正環境; 文境界; 現代日本語書き言葉均衡コーパス
URL: https://repository.ninjal.ac.jp/?action=repository_uri&item_id=471
http://id.nii.ac.jp/1328/00000462/
https://repository.ninjal.ac.jp/?action=repository_action_common_download&item_id=471&item_no=1&attribute_id=54&file_no=1
BASE
Hide details
20
〈論文紹介〉 保田祥,小西光,浅原正幸,今田水穂,前川喜久雄 「『現代日本語書き言葉均衡コーパス』に対する時間情報表現・事象表現間の時間的順序関係アノテーション」 言語処理学会誌『自然言語処理』20(5): 657-681. (2013)
加藤 祥. - : 国立国語研究所, 2015
BASE
Show details

Page: 1 2

Catalogues
0
0
0
0
0
0
0
Bibliographies
0
0
0
0
0
0
0
0
0
Linked Open Data catalogues
0
Online resources
0
0
0
0
Open access documents
21
0
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern