本研究では統計情報などのような数値データを対象とした質問応答システムに必要な技術の研究開発を行う.数値データから得られる情報にはデータに格納されている値だけでなく,それらの値を計算することによって得られる情報などもある.そのため,入力された質問文がどのような計算を必要とするかを解析する必要がある.本年度はその解析の基礎となる述語項構造解析器の開発を行った.規則的に決定できる項に関してはルールベースのモデルによる同定を行い,そうでない項に関しては機械学習ベースのモデルによって推定するモデルを開発しているが,省略要素の推定の精度が高いとはいえず,既存の推定器の性能に到達できていない. 言語による数値の扱いは一般的な言語理解において必要な機能の一つであり,本研究はそれに特化している.しかし,一般的な言語理解というものに対して他にどのような機能が必要となるかはこれまであまり整理おらず,本研究は言語理解というタスクにおいてどのように位置づけでき,他にどのような要素が関係するかがそれほど明らかではなかった.そこで本研究開発と並行して,言語理解タスクにおいて,問題解決に必要な機能を既存の言語理解タスクのデータセットを分析し,分類を行った.言語理解を単語の理解や述語項関係などの節内の事象の理解と,因果関係などのようなその事象間の関係の理解とに分けて考え,後者に焦点を当てた現時点における分類を発表した.
|