2017 Fiscal Year Research-status Report
Project/Area Number |
16K02714
|
Research Institution | National Institute for Japanese Language and Linguistics |
Principal Investigator |
宮嵜 由美 大学共同利用機関法人人間文化研究機構国立国語研究所, 音声言語研究領域, プロジェクト非常勤研究員 (90771163)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | LINEデータベース / 携帯メールデータコーパス / 会話文へのアノテーション付与 / 日常会話コーパス / 待遇表現 / ポライトネス / 会話文の同定 / 話し言葉的書き言葉 |
Outline of Annual Research Achievements |
今回の科学研究費申請内容の大きな柱となる「話し言葉のような書き言葉」について,具体的には①LINE,②小説の会話文,③ケータイメールの3つの媒体における「話ことばのような書き言葉」の再現性の高いデータベース化と属性付与について,今年度は下記のような検討と作業,研究発表を行った。 <2017年度>①LINEデータベース構築の為,昨年度検討した収集方法やデータベース構築規則に基づき,データ収集を行っている。②また,書き言葉における話し言葉として,『現代日本語書き言葉均衡コーパス』収録の小説を比較対象として,2016年度研究発表から得られた意見や,情報付与作業から,さらに発話箇所認定規則の更新行った。③さらに,LINEデータとの比較も視野に,携帯メールデータコーパス(加藤安彦氏監修)公開に向け,三宅和子氏,田中ゆかり氏,林直樹氏とともに2016年度行ったデータ入力修正規則をもとにデータ入力修正の外注作業を行い,その確認,修正作業を行っている。公開まで最終段階に入っている。 ■宮嵜由美・柏野和佳子・山崎誠(2018)「『現代日本語書き言葉均衡コーパス』収録の小説における発話箇所認定について」シンポジウム「日常会話コーパス」III ■その他2018年度発表・公開予定■Makoto Yamazaki, Yumi Miyazaki, Wakako Kashino.(2018) Annotation and Quantitative Analysis of Speaker Information in NovelConversation Sentences in Japanese.LREC 2018, Eleventh International Conference on Language Resources and Evaluation 宮嵜由美(2018)「Q.これまでの絵文字顔文字とLINEのスタンプでは何か違うのでしょうか?」ことば研究館(仮)国立国語研究所webページで公開予定
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
2017年度末現在,①2016年度に検討したLINEデータの収集方法の元,LINEデータ収集を行っている。②一部テキスト化が必要なデータの整備はほぼ完了している。③さらに,再現可能なデータとして,データベース化の作業も順調に行っている。 ②『現代日本語書き言葉均衡コーパス』に収録された小説における会話文のアノテーション情報整備に向け,2017年度の作業や研究成果から,会話として認定できる範囲の再検討やコーパスへの反映,付与すべき属性の選択やコーディング,公開時のインターフェイスを想定したコーパス構築設計の検討を行っている。2018年度末の完成に向け,作業対象も広げたうえで,完成を目指している。 ③『携帯メールコーパス』公開に向け,データの整備の為に検討した方針に基づき,作業の外部発注を行い,その確認作業を行っている。2018年度にはデータベース公開の為の研究発表を予定している。
|
Strategy for Future Research Activity |
①LINE自然データの収集を続け,そのデータ整備から得られた知見から,画像データの再現を可能としたデータベース化を続ける。LINEデータベースの構築に関する発表や,LINEにおける待遇表現に関する研究論文を執筆していく予定。
②『現代日本語書き言葉均衡コーパス』に収録された小説における会話文のアノテーション情報整備と発話箇所認定作業からみえてきた事象に関する論文執筆を行う。
③携帯メールという電子コミュニケーション媒体をコーパス化するにあたり『携帯メールコーパス』公開に向け,研究に耐えうるデータ構築の方法や,LINEデータとの比較からみえる事象に関する論文を執筆する。
|
Causes of Carryover |
2016年度分の予算の2017年度への繰り越しを行い,2017年度は下記のデータ収集,データ整備に関する支出を行ったが,2016年度分の繰越金が大きいため,2018年度への繰り越し金が生じている。 ①LINEデータ提供に関わる謝金②LINEデータ収集後のデータベース化に関わる作業謝金③「携帯メールコーパス」のデータ整備に関わる外注④それらデータ整備から得られたデータに関する研究発表に関わる支出。
|