Home
Catalogue search
Refine your search:
Keyword
Creator / Publisher
Year:
2021 (1)
2020 (1)
2019 (1)
Medium
Type:
Article (3)
BLLDB-Access:
free (3)
subject to license (0)
Search in the Catalogues and Directories
All fields
Title
Creator / Publisher
Keyword
Year
AND
OR
AND NOT
All fields
Title
Creator / Publisher
Keyword
Year
AND
OR
AND NOT
All fields
Title
Creator / Publisher
Keyword
Year
AND
OR
AND NOT
All fields
Title
Creator / Publisher
Keyword
Year
AND
OR
AND NOT
All fields
Title
Creator / Publisher
Keyword
Year
Sort by
creator [A → Z]
'
creator [Z → A]
'
publishing year ↑ (asc)
'
publishing year ↓ (desc)
'
title [A → Z]
'
title [Z → A]
'
Simple Search
Hits 1 – 3 of 3
1
『日本語日常会話コーパス』での形態素解析:誤解析箇所の分析
渡邊 友香
;
西川 賢哉
;
Yuka WATANABE
...
In: https://ccd.ninjal.ac.jp/lrw2021.html (2021)
BASE
Show details
2
『日本語日常会話コーパス』に対する短単位情報付与:作業工程と評価
西川 賢哉
;
渡邊 友香
;
Ken'ya Nishikawa
;
Yuka Watanabe
In: https://pj.ninjal.ac.jp/corpus_center/lrw2020.html (2020)
Abstract:
National Institute for Japanese Language and Linguistics ; National Institute for Japanese Language and Linguistics ; 会議名: 言語資源活用ワークショップ2020, 開催地: オンライン, 会期: 2020年9月8日−9日, 主催: 国立国語研究所 コーパス開発センター ; 『日本語日常会話コーパス』(CEJC)の短単位情報付与作業では、以下のような作業工程を踏んでいる:(i) 転記をMeCab(解析器)+ UniDic(解析辞書)で自動解析、(ii) 音声を聴取しながら、付加情報の一つである「発音形」のみを人手修正、(iii) 人手修正された発音形を尊重しつつ再び自動解析、(iv) 短単位情報(境界情報、発音形以外の付加情報)を人手修正。この作業工程の妥当性を検証するため、人手修正済みデータを対象に、複数の版の現代話し言葉UniDic(Ver2.2.0, 2.3.0, 3.0.1)で自動解析をしなおし、出力を比較した。その結果、どの版のUniDicを使っても、人手修正された発音形の情報を用いる方が、そうでない場合に比べ、短単位情報の精度向上を見込めることがわかった。特に、古い版のUniDic (Ver2.2.0)ではそれが顕著であった(境界+品詞+語彙素(F値):0.944→0.962)。一方で、最新版のUniDic (Ver3.0.1)では効果は限定的である(同:0.976→0.979)。
Keyword:
Corpus of Everyday Japanese Conversation (CEJC)
;
日本語日常会話コーパス(CEJC)
URL:
http://id.nii.ac.jp/1328/00003172/
https://repository.ninjal.ac.jp/?action=repository_action_common_download&item_id=3188&item_no=1&attribute_id=48&file_no=1
https://repository.ninjal.ac.jp/?action=repository_uri&item_id=3188
BASE
Hide details
3
『日本語日常会話コーパス』の短単位解析:作業工程を中心に
西川 賢哉
;
渡邊 友香
;
Ken'ya Nishikawa
...
In: https://pj.ninjal.ac.jp/corpus_center/lrw2019.html (2019)
BASE
Show details
Mobile view
All
Catalogues
UB Frankfurt Linguistik
0
IDS Mannheim
0
OLC Linguistik
0
UB Frankfurt Retrokatalog
0
DNB Subject Category Language
0
Institut für Empirische Sprachwissenschaft
0
Leibniz-Centre General Linguistics (ZAS)
0
Bibliographies
BLLDB
0
BDSL
0
IDS Bibliografie zur deutschen Grammatik
0
IDS Bibliografie zur Gesprächsforschung
0
IDS Konnektoren im Deutschen
0
IDS Präpositionen im Deutschen
0
IDS OBELEX meta
0
MPI-SHH Linguistics Collection
0
MPI for Psycholinguistics
0
Linked Open Data catalogues
Annohub
0
Online resources
Link directory
0
Journal directory
0
Database directory
0
Dictionary directory
0
Open access documents
BASE
3
Linguistik-Repository
0
IDS Publikationsserver
0
Online dissertations
0
Language Description Heritage
0
© 2013 - 2024 Lin|gu|is|tik
|
Imprint
|
Privacy Policy
|
Datenschutzeinstellungen ändern