研究課題/領域番号 |
14J05820
|
研究機関 | 東北大学 |
研究代表者 |
高瀬 翔 東北大学, 情報科学研究科, 特別研究員(DC1)
|
研究期間 (年度) |
2014-04-25 – 2017-03-31
|
キーワード | 自然言語処理 / 情報抽出 / 知識獲得 / 関係抽出 / 表現学習 |
研究実績の概要 |
本研究の目標は「タバコが癌を引き起こす」と「タバコは癌のリスクを高める」、「タバコが癌の発生する危険性を増加させる」などの文が全て「タバコ」と「癌」の間の因果関係を示すというように、名詞間の意味的関係を認識・獲得し、関係知識の知識ベースを構築することである。これを達成するために、昨年度は名詞間の関係を表す表現(以下、関係表現と呼ぶ)の意味計算に取り組み、大きく分けて2つの成果をあげた。 ひとつめは関係表現の意味計算の性能を評価するためのデータセットを作成した事である。名詞間の意味的関係を認識・獲得するためには、関係表現の意味計算が重要であると考えられるが、既存の研究では、自然言語の文と知識ベースとを結びつけることに主に焦点が当てられており、関係表現の意味計算は軽視されていた。報告者は関係表現の意味計算を部分問題として切り出し、評価用のデータを作成することで、関係知識獲得において、より詳細な評価・分析を可能とした。また、関係表現の意味計算の性能と関係知識の抽出性能に相関があることを示し、関係表現の意味計算を行うことの重要性を明らかにした。 ふたつめはロングテールの関係表現の意味計算を行うため、構成単語の意味から関係表現の意味を構成性にもとづいて計算する、新たな手法を提案した事である。これは26年度の成果を発展させたものであり、26年度の手法よりも高性能な意味計算を可能とした。具体的には、ニューラルネットワークにおけるゲートという機構を加法構成性に導入することにより、関係表現の意味計算において重要な単語とそうでない単語とを区別しつつ意味計算が可能となるような手法を提案した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
研究課題において根幹の問題である、構成性にもとづいた関係表現の意味計算において、26年度よりも精度良く行える手法を提案しており、おおむね順調に進展していると言える。また、関係表現の意味計算についての評価用データを作成することで、関係表現の意味計算を行うことが名詞間の関係の認識・獲得に重要であると明らかにし、本研究課題の重要性を示した。
|
今後の研究の推進方策 |
今後は関係表現の意味計算の精緻化を行い、それを関係知識の獲得および質問応答に応用する予定である。 関係表現の意味計算は自然言語と知識ベースを結びつけるために重要であり、これを用いることによって、知識の獲得・質問応答の双方が可能になると考えられる。例として、因果関係を表す、「リスクを高める」という関係表現について考える。この関係表現の意味計算を行うことによって、「タバコは癌のリスクを高める」という文からは、「タバコ」と「癌」の間に因果関係があるという知識が得られる。また、「癌のリスクを高めるものは何か?」という質問に対しては、「癌」と因果関係にある名詞を知識ベースから抽出すれば良いということが分かる。 上記を達成するために、構成要素から計算した関係表現の意味と知識ベースを結びつけるを探求する。
|