本研究では、自然言語システムの出力の根拠を示すために利用する機械可読で構造化された世界知識を構築する。具体的には、トップダウンに定義された固有表現の知識フレームに半構造化されたデータであるWikipediaの内容を埋め込むことによって、30言語に渡るノイズが少ない大規模知識の構築を目指す。 自然言語処理応用システムが信頼を得るためには、出力結果の根拠を利用者に提示することが必要であり、これを実現する知識の作成には大きな意義がある。具体的に期待される成果は、アンサンブル学習を活用し、クラウドワーカーや既存の構造化知識と組み合わせ、より効率的に精度の高い知識を構築する技術の開発、およびこれによる多言語(30言語)構造化知識である。また、構築した知識を無償公開することも成果と期待される。
|