• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2017 年度 実績報告書

異なる言語で記述されたテキスト間の含意関係認識

研究課題

研究課題/領域番号 15K12097
研究機関豊橋技術科学大学

研究代表者

土屋 雅稔  豊橋技術科学大学, 情報メディア基盤センター, 准教授 (70378256)

研究期間 (年度) 2015-04-01 – 2018-03-31
キーワード含意関係認識
研究実績の概要

含意関係認識ニューラルネットワークモデル(日本語および英語)を作成し,性能評価を行った.その評価の過程において,2つの知見を得た.第1に,英語含意関係コーパス(SNLIコーパス)から学習したニューラルネットワークモデルは,同一コーパスのテストセットに対しては高い精度(80-90%)を発揮するにも関わらず,異なる構築方法によって作成された別の英語含意関係認識コーパス(SICKコーパス)のテストセットに対しては,非常に不自然な性能劣化(60%)を示すという点である.SNLIコーパスとSICKコーパスは,ともに同一ドメインの英文を対象として構築されている含意関係コーパスであり,未知語率は十分に低く,ドメインの相違が理由とは考えられない.また,SNLIコーパスは,ラベル分布が均等になるように設計されている平衡コーパスであり,ラベルの偏りが原因とも考えられない.この性能劣化の原因を調査するため,確率統計モデルに基づく新たなコーパスの偏りの分析手法を提案した.この分析手法は,コーパスのラベル分布などの一般的な統計指標によっては見つけることができない,より深い分析を必要とする偏りを定量的に示すことが可能である.また,定性的な分析により,コーパス作成作業者の語彙選択上の無意識のバイアスが原因であることを明らかにした.第2に,現代的な規模のニューラルネットを学習するという観点からは,既存の日本語含意関係コーパスは,量および品質の両方の観点から不十分であることを明らかにした.

  • 研究成果

    (3件)

すべて 2018 2017

すべて 雑誌論文 (2件) (うち査読あり 2件、 オープンアクセス 2件) 学会発表 (1件)

  • [雑誌論文] Performance Impact Caused by Hidden Bias of Training Data for Recognizing Textual Entailment2018

    • 著者名/発表者名
      Masatoshi Tsuchiya
    • 雑誌名

      Proceedings of the 11th International Conference on Language Resources and Evaluation

      巻: - ページ: 1506-1511

    • 査読あり / オープンアクセス
  • [雑誌論文] Automatic Alignment between Classroom Lecture Utterances and Slide Components2017

    • 著者名/発表者名
      Masatoshi Tsuchiya, Ryo Minamiguchi
    • 雑誌名

      Proceedings of Interspeech2017

      巻: - ページ: 2904-2908

    • DOI

      10.21437/Interspeech.2017-1752

    • 査読あり / オープンアクセス
  • [学会発表] 含意関係認識コーパスの偏りによる性能評価への影響2017

    • 著者名/発表者名
      土屋雅稔
    • 学会等名
      情報処理学会自然言語処理研究会

URL: 

公開日: 2018-12-17  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi