• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2013 年度 実施状況報告書

否定焦点コーパス構築と焦点自動解析に関する研究

研究課題

研究課題/領域番号 25870278
研究種目

若手研究(B)

研究機関山梨大学

研究代表者

松吉 俊  山梨大学, 医学工学総合研究部, 助教 (10512163)

研究期間 (年度) 2013-04-01 – 2015-03-31
キーワード自然言語処理 / コーパス言語学 / 否定表現 / モダリティ
研究概要

本研究では、現代日本語における否定焦点の統計的分布を明らかにするとともに、否定の焦点を自動的に特定する解析システムを実装する。本年度は、次の4点を実施した。1.文献調査、2.コーパス構築、3.否定焦点の分析、4.データフォーマット仕様の策定。
具体的には、まず、否定辞、および、否定の焦点に関する先行研究と文献を調査した。この調査の結果、否定要素と呼応する程度・頻度の副詞が重要であり、特に、完全否定と弱否定の分類が焦点の有無に深く関わることが分かった。日本語においては、とりたて詞の種類が否定焦点の位置に影響し、とりたて詞のスコープと否定辞のスコープの包含関係により、文の解釈が決定することを考慮する必要があるという知見も得られた。次に、否定の焦点に関するコーパスを構築した。テキストデータとしては、楽天データの「楽天トラベル: レビューデータ」と、現代日本語書き言葉均衡コーパスの新聞データを利用した。約1万文のテキストデータから、否定辞を含む文2,147文を抽出し、否定辞の種類と焦点の情報を人手で記述した。否定のスコープの一部に焦点がある場合は、全体の約23%であることや、ジャンルによって焦点部分の品詞列に異なる傾向があること等、統計的分布に関する知見が得られた。続いて、否定焦点をとりまく文脈について分析を行った。その結果、対象文内の内容語とその前文脈の内容語との関連性を単純に計測するだけでは、否定焦点の特定に十分ではなく、もう少し深い意味解析が必要であることが分かった。最後に、否定焦点コーパスをコミュニティで共有するためのデータフォーマット仕様を提案した。これに従うと、同一のテキストに対する複数の追記言語情報を統一的に扱うことができる。これは意義のある提案であり、コーパスを利用する言語研究分野の発展に貢献すると思われる。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

研究の目的の「否定の焦点をラベル付けしたコーパスの構築」と「否定焦点の分析」がほぼ予定どおりに進んでいるため。否定焦点の分析の結果を受け、次年度開始予定であった「解析システム実装」にも前倒しで取り組んでいる。

今後の研究の推進方策

計画通り、「コーパス構築」、「否定焦点の分析」、「解析システム実装」を実施する。システムの開発後、その評価を行い、構築した言語資源の有効性を検証する。

次年度の研究費の使用計画

次の3点が理由である。1. コーパス構築に携わる適切な技術補佐員を探すことができず、謝金の支出がなかったため。2. 計画に挙げていた外国での研究発表の機会が今年度はなかったため。3. 年度末に学会誌に採録が決定した論文の別刷代の支払いが、次年度となったため。
解析システム開発・運用のための計算機については、翌年度の計画どおりに購入する。早急にコーパス構築のための技術補佐員を探し、前年度分と合わせ、コーパス構築に関する作業に研究費を使用する。国際会議に論文を投稿し、海外での研究成果発表にも研究費を使用する。

  • 研究成果

    (4件)

すべて 2014 その他

すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (3件)

  • [雑誌論文] 否定の焦点情報アノテーション2014

    • 著者名/発表者名
      松吉俊
    • 雑誌名

      自然言語処理

      巻: 21 (2) ページ: 249-270

    • 査読あり
  • [学会発表] 含意認識タスクに関するかき混ぜ文対データの構築

    • 著者名/発表者名
      名取芙美香、松吉俊、福本 文代
    • 学会等名
      言語処理学会第20回年次大会
    • 発表場所
      北海道大学(北海道)
  • [学会発表] 拡張CaboChaフォーマットの仕様拡張

    • 著者名/発表者名
      松吉俊、浅原正幸、飯田龍、森田敏生
    • 学会等名
      第5回コーパス日本語学ワークショップ
    • 発表場所
      国立国語研究所(東京都)
  • [学会発表] Web掲示板における皮肉の分類および自動検出

    • 著者名/発表者名
      磯野史弥、松吉俊、福本文代
    • 学会等名
      情報処理学会 第213回自然言語処理研究会
    • 発表場所
      山梨大学(山梨県)

URL: 

公開日: 2015-05-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi