研究実績の概要 |
本年度はまず、本研究の基礎となる依存構造に対する左隅型構文解析に関する研究を雑誌論文にまとめ、それが出版された。また本論文は学会の本年度の最優秀論文に選ばれた。 本年度の研究課題である教師なし構文解析への応用については、昨年度からアルゴリズムの開発を進めており、本年度はその手法の多言語データに渡る評価及び改良を進めた。本研究の目的は、言語には普遍的に深い中央埋め込み構造が少ないという観察をもとに、中央埋め込み構造を検出することのできる左隅型構文解析の上で、中央埋め込み構造を避けるようなモデルを構築し、教師なし学習におけるこのバイアスの影響を調べることである。 研究の途中で教師なし構文解析は特に手法間の評価の仕方が問題であることが判明し、本年度はこの改善についても取り組んだ。主な問題点は、一つの文に対する正しい依存構造は言語学の異なる理論毎に複数存在するものの、従来の評価手法では、現在用いている一種類の正解の依存構造に対する評価しか行えないというものである。この問題を軽減するため、本研究ではモデルの探索範囲を現在仮定している言語理論のものに限定する方法を開発し、このうえで評価実験を行った。 深い中央埋め込み構造を避けるように学習を行う際、どれだけの深さの中央埋め込み構造を許容するか、という点が問題となるが、本研究では、埋め込まれる句の長さを2,3単語に限定する、という方法が特に有効であることが分かり、これを用いると、既存手法である依存構造の長さに基づくバイアスと比較してより性能の良いモデルが多言語に渡り学習されることが分かった。
|