DE eng

Search in the Catalogues and Directories

Page: 1 2
Hits 1 – 20 of 34

1
EMAによる調音運動観測のための咬合面と口蓋の計測法
能田 由紀子; 北村 達也; 浅井 拓也. - : 日本音響学会, 2021
BASE
Show details
2
リアルタイムMRI動画データベースプロジェクトの概要と調音音声学への応用
In: https://ccd.ninjal.ac.jp/lrw2021.html (2021)
BASE
Show details
3
リアルタイムMRI調音動画データの閲覧および解析環境の開発
In: https://ccd.ninjal.ac.jp/lrw2021.html (2021)
BASE
Show details
4
『日本語話し言葉コーパス』CSJ-RDB Version 2.0 利用の手引き
小磯 花絵; 伝 康晴; 前川 喜久雄. - : 国立国語研究所, 2021
BASE
Show details
5
KOTONOHA : A Corpus Concordance System for Skewer-Searching NINJAL Corpora
Teruaki Oka; Yuichi Ishimoto; Yutaka Yagi. - : European Language Resources Association, 2020
BASE
Show details
6
Remarks on Japanese /w/
Kikuo Maekawa. - : 国際基督教大学, 2020
BASE
Show details
7
リアルタイムMRI動画日本語調音運動データベースの設計
In: https://pj.ninjal.ac.jp/corpus_center/lrw2020.html (2020)
BASE
Show details
8
『日本語話し言葉コーパス』への声質情報付与と予備的分析
In: https://pj.ninjal.ac.jp/corpus_center/lrw2019.html (2019)
BASE
Show details
9
Speech organ contour extraction using real-time MRI and machine learning method
BASE
Show details
10
Five pieces of evidence suggesting large lookahead in spontaneous monologue
Kikuo Maekawa. - 2019
BASE
Show details
11
An Investigation into Modern Mongolian Vowel Harmony Using Real-time Magnetic Resonance Imaging
Yoshio Saito; Yurong; Kikuo Maekawa. - : The International Phonetic Association, 2019
BASE
Show details
12
A real-time MRI study of Japanese moraic nasal in utterance-final position
Kikuo Maekawa. - : The International Phonetic Association, 2019
BASE
Show details
13
ベイズモデルによる方言音声共通語化過程の分析
In: https://pj.ninjal.ac.jp/corpus_center/lrw2018.html (2018)
BASE
Show details
14
モンゴル語アクセント研究のためのデータベース
In: http://pj.ninjal.ac.jp/corpus_center/lrw2016.html (2017)
BASE
Show details
15
日本語話し言葉コーパスにおける発声様式の自動分類
In: http://pj.ninjal.ac.jp/corpus_center/lrw2016.html (2017)
BASE
Show details
16
モンゴル語アクセント研究のためのデータベース(2)
In: http://pj.ninjal.ac.jp/corpus_center/lrw2017.html (2017)
BASE
Show details
17
鶴岡市共通語化調査データの確率論的再検討
In: http://pj.ninjal.ac.jp/corpus_center/lrw2017.html (2017)
BASE
Show details
18
日本語コーパスの包括的検索環境の実現に向けて
In: http://pj.ninjal.ac.jp/corpus_center/lrw2016.html (2017)
BASE
Show details
19
『現代日本語書き言葉均衡コーパス』の文境界修正
小西 光; 中村 壮範; 田中 弥生. - : 国立国語研究所, 2015
BASE
Show details
20
Webを母集団とした超大規模コーパスの開発 : 収集と組織化
Abstract: 国立国語研究所 コーパス開発センター ; 国立国語研究所 コーパス開発センター プロジェクト研究員 ; 国立国語研究所 コーパス開発センター プロジェクト研究員 ; 国立国語研究所 コーパス開発センター 非常勤研究員 ; 国立国語研究所 言語資源研究系 ; Center for Corpus Development, NINJAL ; Postdoctoral Research Fellow, Center for Corpus Development, NINJAL ; Postdoctoral Research Fellow, Center for Corpus Development, NINJAL ; Adjunct Researcher, Center for Corpus Development, NINJAL ; Department of Corpus Studies, NINJAL ; 国立国語研究所コーパス開発センターでは2011年より超大規模コーパスプロジェクトとして,Webを母集団とした100億語規模のコーパスの構築を進めている。構築にあたっては,工程を収集・組織化・利活用・保存の四つに分割して実装を進めている。本論文ではそのうち最初の2工程について報告する。収集に関しては,2012年第4四半期より3か月ごとに1億URLのクロールを繰り返し実施している。また組織化に関しては,2013年第3四半期までの約1年間に収集されたWebページの文抽出・形態素解析・係り受け解析を実施した。これらの作業に生じた問題とその解決法を示した後,2013年末において構築されたコーパスデータの基礎統計量を示し,本コーパスを用いてどのような理論的・応用的研究が可能になると考えられるかを論じる。 ; In 2011, the National Institute for Japanese Language and Linguistics launched a corpus compilation project with the aim of constructing a ten-billion-word Web corpus. The project was split into the following four sub-projects: page collection, linguistic annotation, release, and preservation. During the page collection stage, crawling began during the fourth quarter of 2012. We crawled 100 million URLs every three months as fixed-point observations. During the linguistic annotation, normalization (HTML tag removal and character encoding conversion), Japanese morphological analysis (word segmentation and part-of-speech tagging), and Japanese dependency analysis were performed on the data that were crawled in the timespan of one year, specifically from the fourth quarter of 2012 to the third quarter of 2013. In this paper, we present the basic statistics of the crawled data and discuss possible theoretical and practical implications of the language resources. Additionally, we address issues encountered during the page collection and linguistic annotation stages, and offer tentative solutions.
Keyword: corpus development; linguistic analyzers; linguistic information indexing; web archive; Webアーカイブ; コーパス構築; 言語情報組織化; 言語解析
URL: http://id.nii.ac.jp/1328/00000522/
https://repository.ninjal.ac.jp/?action=repository_uri&item_id=531
https://repository.ninjal.ac.jp/?action=repository_action_common_download&item_id=531&item_no=1&attribute_id=54&file_no=1
BASE
Hide details

Page: 1 2

Catalogues
0
0
0
0
0
0
0
Bibliographies
0
0
0
0
0
0
0
0
0
Linked Open Data catalogues
0
Online resources
0
0
0
0
Open access documents
34
0
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern