2014 年度実績報告書

否定焦点コーパス構築と焦点自動解析に関する研究

研究課題

研究課題/領域番号	25870278
研究機関	山梨大学
研究代表者	松吉俊山梨大学, 総合研究部, 助教 (10512163)
研究期間 (年度)	2013-04-01 – 2015-03-31
キーワード	自然言語処理 / コーパス言語学 / 否定表現 / モダリティ
研究実績の概要	本研究では、現代日本語における否定焦点の統計的分布を明らかにするとともに、否定の焦点を自動的に特定する解析システムを実装する。本年度は、次の3点を実施した。(i)コーパス整備、(ii)解析システム実装、(iii)システムの評価。具体的には、現代日本語書き言葉均衡コーパスの新聞データに付けたラベルを丁寧に見直した。加えて、昨年度提案した、コミュニティで共有するためのデータフォーマット仕様のファイルを、コーパスから自動生成するプログラムを構築した。分析した否定焦点の統計的分布に基づいて、ルールベースにより否定の焦点を解析するシステムを実装した。このシステムは、大分類で14個のルールを持っている。否定辞を含む1文が入力されると、システムは、その文に存在する手がかり語句を検出し、それらの優先度に応じてルールを適用し、否定の焦点を解析する。手がかり語句としては、主に、副詞、とりたて詞、構文パターンを利用した。構築したコーパスを用いて評価した結果、提案システムは、レビューデータにおいて78%、新聞データにおいて80%の正解率を達成した。単純な規則に基づくベースラインシステムの正解率は、それぞれ68%と73%であり、その性能を10%ほど上回る成果を達成することができた。研究期間全体を通じた主な研究成果は、以下の3つである。(1) 約1万文のテキストデータを対象として、2,147個の否定辞とその焦点にラベルを付けたコーパスを構築した。(2) このコーパスを分析し、否定辞とその焦点に関して統計的分布を明らかにした。(3) 約79%の性能の否定焦点解析システムを実装した。構築したコーパス、および、そこから得られた知見は、コーパス言語学分野において重要であり、その発展に寄与すると思われる。実装した解析システムは、事実性解析や情報検索・情報抽出の発展を促す、意義のある成果であると考える。
備考	本研究成果に関して論文誌『自然言語処理』に投稿した雑誌論文「否定の焦点情報アノテーション」が、2014年度論文賞を受賞。(学会HP: http://www.anlp.jp/award/ronbun.html)

研究成果
(3件)

すべて 2015 2014 その他

すべて学会発表 (2件) (うち招待講演 1件) 備考 (1件)

[学会発表] 否定の焦点情報アノテーション2015
- 著者名/発表者名
  松吉俊
- 学会等名
  言語処理学会第21回年次大会
- 発表場所
  京都大学 (京都市)
- 年月日
  2015-03-18
- 招待講演
[学会発表] Annotating the Focus of Negation in Japanese Text2014
- 著者名/発表者名
  Suguru Matsuyoshi, Ryo Otsuki, and Fumiyo Fukumoto
- 学会等名
  Proceedings of the 9th edition of the Language Resources and Evaluation Conference (LREC2014)
- 発表場所
  Reykjavik (Iceland)
- 年月日
  2014-05-29
[備考] 日本語否定の焦点情報アノテーションコーパス
- URL
  http://cl.cs.yamanashi.ac.jp/nldata/negation/

2014 年度 実績報告書

否定焦点コーパス構築と焦点自動解析に関する研究

研究代表者

松吉 俊 山梨大学, 総合研究部, 助教 (10512163)

研究成果

[学会発表] 否定の焦点情報アノテーション2015

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Annotating the Focus of Negation in Japanese Text2014

著者名/発表者名

学会等名

発表場所

年月日

[備考] 日本語否定の焦点情報アノテーションコーパス

URL

2014 年度実績報告書

松吉俊山梨大学, 総合研究部, 助教 (10512163)