• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2012 年度 実績報告書

解析アクションの先読みに基づく高速・高精度な自然言語文解析

研究課題

研究課題/領域番号 23700162
研究機関東京大学

研究代表者

鶴岡 慶雅  東京大学, 工学(系)研究科(研究院), 准教授 (50566362)

キーワード自然言語処理 / 機械学習 / 品詞タグ付け / 固有表現認識 / 構文解析 / 探索 / アルゴリズム / 評価関数
研究概要

本研究課題では、基盤的な自然言語処理技術である、品詞タグ付け、固有表現認識、構文解析などの、構造予測問題と呼ばれるタスクに対する新しい機械学習アプローチの提案を行った。提案手法は、解析アクションの履歴に基づくアプローチをベースとし、それに先読み機構を統合することで、解析精度の大幅な向上を図っている。具体的には、品詞タグ付けタスクであれば個々の単語に対するタグ付けのアクションを、構文解析であれば、Shift や Reduce といった解析アクションを先読みすることで、現時点でのスコアではなく、将来的な有望さに基づいてアクションを選択することを可能にしている。
提案手法を実現するにあたって最も難しい問題は、状態を評価する関数のパラメータをどのようにして学習するかという問題であるが、本研究では、学習時においても、先読みによって計算されたアクションの最適パスを用いて評価関数の最適化を行うというアプローチをとることでこの問題を解決した。具体的な最適化のアルゴリズムとしては、平均化パーセプトロンに基づく手法を提案し、その収束性を理論的に明らかにした。
提案手法を、英語の品詞タグ付け、固有表現認識、係り受け解析タスクに適用した結果、このようなタスクに対して幅広く使われている「条件付確率場」を用いた手法よりも、解析精度、計算量の点で優れた性能を達成できることを示した。特に、品詞タグ付けと固有表現認識については、計算コスト同等の条件で比較した場合、世界最高レベルの精度を実現している。また、提案手法を、近年注目を集めている「最易優先方策」と組み合わせることで、さらなる精度向上が可能であることを示した。

  • 研究成果

    (1件)

すべて 2013

すべて 学会発表 (1件)

  • [学会発表] 先読みを用いた単語系列ラベリングへの最易優先方策の適用2013

    • 著者名/発表者名
      佐野峻平
    • 学会等名
      言語処理学会第19回年次大会
    • 発表場所
      名古屋・名古屋大学
    • 年月日
      20130312-20130315

URL: 

公開日: 2014-07-24  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi