Home
Catalogue search
Refine your search:
Keyword:
UniDic (3)
Corpus of Everyday Japanese Conversation (CEJC) (2)
日本語日常会話コーパス(CEJC) (2)
Josei no kotoba (1)
dansei no kotoba (Shokuba hen) (1)
現日研・職場談話コーパス (1)
Creator / Publisher
Year
Medium:
Online (3)
Type
BLLDB-Access
Search in the Catalogues and Directories
All fields
Title
Creator / Publisher
Keyword
Year
AND
OR
AND NOT
All fields
Title
Creator / Publisher
Keyword
Year
AND
OR
AND NOT
All fields
Title
Creator / Publisher
Keyword
Year
AND
OR
AND NOT
All fields
Title
Creator / Publisher
Keyword
Year
AND
OR
AND NOT
All fields
Title
Creator / Publisher
Keyword
Year
Sort by
creator [A → Z]
'
creator [Z → A]
'
publishing year ↑ (asc)
'
publishing year ↓ (desc)
'
title [A → Z]
'
title [Z → A]
'
Simple Search
Hits 1 – 3 of 3
1
『日本語日常会話コーパス』での形態素解析:誤解析箇所の分析
渡邊 友香
;
西川 賢哉
;
Yuka WATANABE
...
In: https://ccd.ninjal.ac.jp/lrw2021.html (2021)
BASE
Show details
2
『日本語日常会話コーパス』の短単位解析:作業工程を中心に
西川 賢哉
;
渡邊 友香
;
Ken'ya Nishikawa
;
Yuka Watanabe
In: https://pj.ninjal.ac.jp/corpus_center/lrw2019.html (2019)
Abstract:
National Institute for Japanese Language and Linguistics ; National Institute for Japanese Language and Linguistics ; 会議名: 言語資源活用ワークショップ2019, 開催地: 国立国語研究所, 会期: 2019年9月2日−4日, 主催: 国立国語研究所 コーパス開発センター ; 国語研で構築中の『日本語日常会話コーパス』(CEJC)の短単位解析作業について報告する。CEJCにおける短単位情報は、アノテーションの一つであるにとどまらず、(i)発音に関する情報を唯一持つ、(ii)他のアノテーション(長単位・韻律)の初期値作成の際の入力となる、(iii)転記誤りを発見する際の有力な手掛かりとなる、などの点で重要なアノテーションであり、高い精度が求められる。作業は次のように進める。まず、MeCab+UniDicで自動解析したのち、短単位付加情報の一つである「発音形」を、音を聴取しながら人手で修正する。これにより、発音形の精度向上を図る。さらに、修正された発音形を尊重しつつ再び形態素解析を行なうことにより、発音形以外の短単位情報(境界・付加情報)の精度向上をも図る(例:初出店「ショシュツ/テン」→「ハツ/シュッテン」)。その後、短単位解析結果を、形態論情報管理ツール「大納言」で検索・修正できるようにし、引き続き解析誤りを修正していく。修正が進んだ段階で、境界・付加情報に揺れがないかを系統的にチェックする(例:「ミリ/メートル」「ミリ=メートル」)。
Keyword:
Corpus of Everyday Japanese Conversation (CEJC)
;
UniDic
;
日本語日常会話コーパス(CEJC)
URL:
https://repository.ninjal.ac.jp/?action=repository_action_common_download&item_id=2591&item_no=1&attribute_id=48&file_no=1
http://id.nii.ac.jp/1328/00002575/
https://repository.ninjal.ac.jp/?action=repository_uri&item_id=2591
BASE
Hide details
3
『現日研・職場談話コーパス』中納言版公開データの作成
柏野 和佳子
;
大村 舞
;
西川 賢哉
...
In: https://pj.ninjal.ac.jp/corpus_center/lrw2018.html (2018)
BASE
Show details
Mobile view
All
Catalogues
UB Frankfurt Linguistik
0
IDS Mannheim
0
OLC Linguistik
0
UB Frankfurt Retrokatalog
0
DNB Subject Category Language
0
Institut für Empirische Sprachwissenschaft
0
Leibniz-Centre General Linguistics (ZAS)
0
Bibliographies
BLLDB
0
BDSL
0
IDS Bibliografie zur deutschen Grammatik
0
IDS Bibliografie zur Gesprächsforschung
0
IDS Konnektoren im Deutschen
0
IDS Präpositionen im Deutschen
0
IDS OBELEX meta
0
MPI-SHH Linguistics Collection
0
MPI for Psycholinguistics
0
Linked Open Data catalogues
Annohub
0
Online resources
Link directory
0
Journal directory
0
Database directory
0
Dictionary directory
0
Open access documents
BASE
3
Linguistik-Repository
0
IDS Publikationsserver
0
Online dissertations
0
Language Description Heritage
0
© 2013 - 2024 Lin|gu|is|tik
|
Imprint
|
Privacy Policy
|
Datenschutzeinstellungen ändern