DE eng

Search in the Catalogues and Directories

Hits 1 – 7 of 7

1
KOTONOHA : A Corpus Concordance System for Skewer-Searching NINJAL Corpora
Teruaki Oka; Yuichi Ishimoto; Yutaka Yagi. - : European Language Resources Association, 2020
BASE
Show details
2
UniDic非コアデータ : 解析用UniDicのID情報にひも付く追加情報の公開について
In: https://pj.ninjal.ac.jp/corpus_center/lrw2019.html (2019)
BASE
Show details
3
実践医療用語の語構成要素抽出の試み
In: https://pj.ninjal.ac.jp/corpus_center/lrw2018.html (2018)
BASE
Show details
4
『国語研日本語ウェブコーパス』からの新規語彙素獲得の試み
In: https://pj.ninjal.ac.jp/corpus_center/lrw2018.html (2018)
Abstract: National Institute for Japanese Language and Linguistics ; 会議名: 言語資源活用ワークショップ2018, 開催地: 国立国語研究所, 会期: 2018年9月4日-5日, 主催: 国立国語研究所 コーパス開発センター ; 『国語研日本語ウェブコーパス(NWJC)』は、国立国語研究所がこれまで公開してきた『現代日本語書き言葉均衡コーパス(BCCWJ)』や『日本語話し言葉コーパス(CSJ)』と異なり、形態論情報をすべて形態素解析器『MeCab』と『解析用UniDic』を使って自動付与している。『BCCWJ』や『CSJ』といった既存のコーパスの整備の際には、コーパスアノテーションと同時に、形態論情報のデータベースである『UniDic DB』に新規短単位語彙素を追加していた。そのためコーパス整備と同時に『UniDic DB』も拡張されてきたが、『NWJC』は全自動で構築されたため、新規短単位語彙素の検出とDBへの登録が行われておらず、その箇所で自動解析誤りのままとなっている。そこで本研究では、形態素解析を介さず、文字N-gramの出現頻度と連接頻度の情報から文字N-gramの分散表現を作成し、『NWJC』から『UniDic DB』に未登録の新規短単位語彙素の候補を列挙する方法について述べる。これによりDBのさらなる拡張が望めるだけでなく、『UniDic DB』のエクスポートデータで作成される『解析用UniDic』も拡張されるため、それを用いた再解析によって『NWJC』中の誤解析箇所を減らすことにもつながる。
Keyword: NINJAL Web Japanese Corpus (NWJC); UniDic; 国語研日本語ウェブコーパス(NWJC)
URL: https://repository.ninjal.ac.jp/?action=repository_uri&item_id=1709
http://id.nii.ac.jp/1328/00001693/
https://repository.ninjal.ac.jp/?action=repository_action_common_download&item_id=1709&item_no=1&attribute_id=48&file_no=1
BASE
Hide details
5
CRF素性テンプレートの見直しによるモデルサイズを軽量化した解析用UniDic : unidic-cwj-2.2.0とunidic-csj-2.2.0
In: http://pj.ninjal.ac.jp/corpus_center/lrw2017.html (2017)
BASE
Show details
6
『日本語歴史コーパス』における原文KWIC表示機能の実装
In: http://pj.ninjal.ac.jp/corpus_center/lrw2017.html (2017)
BASE
Show details
7
『日本語歴史コーパス』短単位アノテーション作業効率化に向けた形態素解析用辞書『UniDic』の段階的特殊化の検討 : 近松コーパスを例として
In: http://pj.ninjal.ac.jp/corpus_center/lrw2016.html (2017)
BASE
Show details

Catalogues
0
0
0
0
0
0
0
Bibliographies
0
0
0
0
0
0
0
0
0
Linked Open Data catalogues
0
Online resources
0
0
0
0
Open access documents
7
0
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern