研究課題/領域番号 |
18J12945
|
研究機関 | 奈良先端科学技術大学院大学 |
研究代表者 |
吉川 将司 奈良先端科学技術大学院大学, 情報科学研究科, 特別研究員(DC2)
|
研究期間 (年度) |
2018-04-25 – 2020-03-31
|
キーワード | 計算言語学 / 自然言語処理 / 構文解析 / 意味解析 / 定理証明 |
研究実績の概要 |
本研究で取り組んでいる組み合わせ範疇文法(以降CCG)に基づく解析技術の向上により、構文解析結果を用いた推論システムの研究が進んでいる。本年度はその推論システムの性能をさらに改善するために、以下の3つに取り組んだ。 1)ある文に現れる語の文法的な役割が曖昧なときに、別の文に現れる同じ語が曖昧性解消のヒントになることがあり、文章内の複数の文の構造を同時に解析することが有効である。このような着想に基づき、複数の文間の依存関係をマルコフ確率場でモデリングし、これまでの解析手法を双対分解で拡張することによって、高速に複数文の構文構造を解析する手法を考案した。推論システムに組み込み実験を行ったところ、提案法は良好な結果を示した。 2)意味表現を用いた推論システムでは、意味表現間の関係を調べるために自動定理証明器を用いる。推論を補助するために世界知識や、単語間の関係などを論理式の形で明示的に与えることができるが、論理式の数が多くなり推論が遅くなってしまう問題がある。そこで、知識グラフ補完の技術を応用し、大量の知識をコンパクトに表現しつつ高速に推論を行う手法を開発した。推論システムを用いた含意関係認識で、従来手法と比較し、精度を維持したまま問題を処理する速度を大きく改善することができた。 3)推論システムを医療テキストや対話に対する応用に用いるためには、構文解析器がこれらのテキストに対しても頑健である必要がある。しかし、解析器は学習データから異なった分野のテキストに対しては性能が大きく下がってしまうことが知られている。そこで、この問題を解決するため、CCGコーパスより比較的安価に入手できる係り受けコーパスを活用した分野適応に関する研究を行った。医療科学論文、疑問文、音声会話テキスト、数学問題の4つの分野に対して解析性能が改善するか実験を行い、いずれにおいても提案法を用いることで性能が改善した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
CCG解析技術の推論システムへの応用に関する研究は、申請当時の予定には含まれていなかったが、応用に着目することで今後の研究を展開するために必要な知見が得られた。特に3)の分野適応の研究により高精度にCCG解析を行うことができるようになったが、この研究の意義はそれだけにとどまらず、開発した技術を並列句の構造解析の研究に応用することができる。具体的に、本来の研究初年度の予定であった並列句構造についてアノテーションを修正した新しいCCGbankの構築を、自動化することが可能であると考えている。本年度はこのアイデアに基づき、本来の研究課題の並列句の問題を解決できると考える。 また、これらの成果をまとめた論文はNAACL, AAAIといった国際会議に採択され、また言語処理学会若手奨励賞を受賞するなど研究成果は順調に得られている。
|
今後の研究の推進方策 |
現在までの進捗状況で述べたとおり、今年度開発した技術を基に並列句構造解析の研究に取り組む。
|