DE eng

Search in the Catalogues and Directories

Hits 1 – 12 of 12

1
『日本語話し言葉コーパス』CSJ-RDB Version 2.0 利用の手引き
小磯 花絵; 伝 康晴; 前川 喜久雄. - : 国立国語研究所, 2021
BASE
Show details
2
『日本語日常会話コーパス』モニター版の設計・評価・予備的分析
小磯 花絵; 天谷 晴香; 居關 友里子. - : 国立国語研究所, 2020
BASE
Show details
3
『日本語日常会話コーパス』データ公開方針 : 法的・倫理的な観点からの検討を踏まえて
小磯 花絵; 伝 康晴; Hanae KOISO. - : 国立国語研究所, 2018
BASE
Show details
4
「日本語日常会話コーパス」への談話行為アノテーションの試み : タグ選択が困難な事例に焦点を当てて
In: https://pj.ninjal.ac.jp/corpus_center/lrw2018.html (2018)
BASE
Show details
5
『日本語日常会話コーパス』の構築 : 会話収録法に着目して
田中 弥生; 柏野 和佳子; 角田 ゆかり. - : 国立国語研究所, 2018
BASE
Show details
6
会話における「そうしたら」と「そうすると」の出現状況 : 『日本語日常会話コーパス』を題材に
川端 良子; 伝 康晴; Yoshiko KAWABATA. - : 国立国語研究所, 2018
BASE
Show details
7
『日本語日常会話コーパス』モニター公開版の概要
In: https://pj.ninjal.ac.jp/corpus_center/lrw2018.html (2018)
BASE
Show details
8
『日本語日常会話コーパス』のデータ公開方針 : 法的・倫理的な観点から
In: http://pj.ninjal.ac.jp/corpus_center/lrw2017.html (2017)
BASE
Show details
9
『日本語日常会話コーパス』収録の進捗状況
In: http://pj.ninjal.ac.jp/corpus_center/lrw2016.html (2017)
BASE
Show details
10
均衡会話コーパス設計のための一日の会話行動に関する基礎調査
小磯 花絵; 土屋 智行; 渡部 涼子. - : 国立国語研究所, 2016
BASE
Show details
11
〈共同研究プロジェクト紹介〉独創・発展型 : 多様な様式を網羅した会話コーパスの共有化 会話コーパスの共有化に向けて : 転記方式の自動変換
伝 康晴; Yasuharu DEN. - : 国立国語研究所, 2013
BASE
Show details
12
コーパス日本語学のための言語資源 : 形態素解析用電子化辞書の開発とその応用
Abstract: 千葉大学 ; 国立国語研究所 ; 国立国語研究所 ; 京都高度技術研究所 ; 東京大学 ; 情報通信研究機構 ; 国立国語研究所 ; Chiba University ; The National Institute for Japanese Language ; The National Institute for Japanese Language ; ASTEM ; The University of Tokyo ; National Institute of Information and Communications Technology ; The National Institute for Japanese Language ; コーパス日本語学への応用を指向した形態素解析用電子化辞書UniDicを開発した。大規模コーパスに対する形態論情報付与作業には,計算機を用いた形態素解析システムの利用が不可欠であるが,既存の形態素解析システム用辞書には,コーパス日本語学への応用を考える上でさまざまな不都合がある。1つは,単位の認定がある場合には長く,ある場合には短いといった不揃いがあることであり,もう1つは,異表記や異形態に対して同一の見出しが与えられないということである。言語研究で重要な要件となる,このような単位の斉一性や見出しの同一性への対処といったことを中心に,本電子化辞書の設計方針とそれを実装した辞書データベースシステムについて述べる。さらに,この設計の有用性を示すため,表記や語形の変異に関するコーパス分析の事例を紹介する。 ; In this paper, we describe the design and the implementation of an electronic dictionary for morphological analysis, UniDic, which aims particularly at application to Japanese corpus linguistics. It has been indispensable for the development of a large-scale corpus to utilize an automatic morphological analyzer on computer. The existing dictionaries for morphological analyzers, however, reveal lots of problems when used in corpus linguistics, such as unevenness in defining a unit and failure in handling allomorphs and orthographic variants. Our dictionary, in contrast, deals with the uniformity of units and the identity of indexes, which are important requirements for linguistic analysis of corpora. We adopt multi-level definition of word units, consisting of short-, middle-, and long-unit words, and structured representation of indexes, composed of lemma, word form, orthography, and pronunciation. We develop a database system that straight-forwardly implements this design of the dictionary and a friendly user-interface for dictionary builders to be capable of searching and registering entries with grasping the complex structure of the indexes. We also show how this structured representation benefits us in analyzing morphologically annotated corpora, presenting case studies that investigate the variation of word form in spoken language corpus and the variation of orthography in written language corpus.
Keyword: database system; electronic dictionary; identity of indexes; morphological analysis; uniformity of units; データベース; 単位の斉一性; 形態素解析; 見出しの同一性; 電子化辞書
URL: https://repository.ninjal.ac.jp/?action=repository_action_common_download&item_id=2201&item_no=1&attribute_id=54&file_no=1
https://repository.ninjal.ac.jp/?action=repository_uri&item_id=2201
http://id.nii.ac.jp/1328/00002185/
BASE
Hide details

Catalogues
0
0
0
0
0
0
0
Bibliographies
0
0
0
0
0
0
0
0
0
Linked Open Data catalogues
0
Online resources
0
0
0
0
Open access documents
12
0
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern