2018 Fiscal Year Research-status Report
物語文と日常会話文における発話文体と話者属性の分析
Project/Area Number |
18K11991
|
Research Institution | Future University-Hakodate |
Principal Investigator |
村井 源 公立はこだて未来大学, システム情報科学部, 准教授 (70452018)
|
Project Period (FY) |
2018-04-01 – 2023-03-31
|
Keywords | 会話文 / 文体 / 自然言語処理 / コーパス / 話者 |
Outline of Annual Research Achievements |
小説内での登場人物の発話の特徴抽出に関しては、国立国語研による現代日本語書き言葉均衡コーパス(Balanced Corpus of Contemporary Written Japanese)からランダムサンプリングした日本文学の100テキストを対象として,発話に相当する部分を抽出し,性別・年齢などの発話者の情報に合わせて,発話者と聴者の間の人間関係(家族,友人,教師と生徒,上司や部下や同僚,店員と客など),発話の行われた場の状況(家庭の日常会話,学校での会話,仕事上の会話,警察の尋問や裁判での弁論など)や発話者の感情状態(喜び,悲しみ,怒り,驚き,恐れなどの基本感情状態に複合的な感情状態も合わせて現在18種類),行われた発話の語用論的な意図(導入,陳述,意思,願望,提案,質問などの機能で分類した大カテゴリ19種類,それらをさらに詳細に分類した小カテゴリ103種類)などに関するタグを定義表に基づいて付与した.また語用論的な機能に関しては他の分析者による分析と照らし合わせて統計的な一致度の検定を行いその分類手法の妥当性を確認した.またそれらのタグに基づいて小説における日本語発話文体の特徴を分析した. また日常会話における発話の特徴に関しては同じく国立国語研究所で現在開発中の日本語日常会話コーパス(Corpus of Everyday Japanese Conversation)の先行公開版に基づき,発話者の年齢・性別による発話文体の特徴の差異を抽出した.
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
二年目で行う予定であった語用論的な機能の分類及びタグ付けまでおおよそ終了している.
|
Strategy for Future Research Activity |
当初計画よりも進捗が早いため,小説文の会話に合わせて日常会話の分析及びそれらの比較を前倒して行うことができるのではないかと考えている.
|
Causes of Carryover |
国内で開催された国際学会で発表したため当初計画よりも旅費が安くなった.その費用をデータ作成の人件費に充当し,より多くのテキストのタグ付けを行うことを目指す.
|