2016 Fiscal Year Research-status Report
Project/Area Number |
16K16120
|
Research Institution | FUJITSU LABORATORIES LTD. |
Principal Investigator |
横野 光 株式会社富士通研究所, その他部局等, 研究員(移行) (60535863)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | 自然言語処理 / 言語理解 |
Outline of Annual Research Achievements |
本研究では統計情報などのような数値データを対象とした質問応答システムに必要な技術の研究開発を行う.数値データから得られる情報にはデータに格納されている値だけでなく,それらの値を計算することによって得られる情報などもある.そのため,入力された質問文がどのような計算を必要とするかを解析する必要がある.本年度はその解析の基礎となる述語項構造解析器の開発を行った.規則的に決定できる項に関してはルールベースのモデルによる同定を行い,そうでない項に関しては機械学習ベースのモデルによって推定するモデルを開発しているが,省略要素の推定の精度が高いとはいえず,既存の推定器の性能に到達できていない. 言語による数値の扱いは一般的な言語理解において必要な機能の一つであり,本研究はそれに特化している.しかし,一般的な言語理解というものに対して他にどのような機能が必要となるかはこれまであまり整理おらず,本研究は言語理解というタスクにおいてどのように位置づけでき,他にどのような要素が関係するかがそれほど明らかではなかった.そこで本研究開発と並行して,言語理解タスクにおいて,問題解決に必要な機能を既存の言語理解タスクのデータセットを分析し,分類を行った.言語理解を単語の理解や述語項関係などの節内の事象の理解と,因果関係などのようなその事象間の関係の理解とに分けて考え,後者に焦点を当てた現時点における分類を発表した.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
数値データに対して行われる計算操作の分析やそれを表す言語表現の分析と解析器の構築のために必要となるデータの作成が遅れているため.
|
Strategy for Future Research Activity |
今後は,まず分析のためのデータ構築を主に研究を推進する.当初計画していたデータ収集に関して,分析に用いるデータとして様々な現象を多く含むような単一ドメインの大規模データを対象とするのではなく,小規模ではあるが様々なドメインも対象としてデータ収集を行う.開発に用いるデータに関しては引き続き利用可能なデータを収集する.
|
Causes of Carryover |
データ構築の計画に遅れが生じているため
|
Expenditure Plan for Carryover Budget |
対象とするデータの種類を変更し,データ作成を行う
|