本研究では、話し言葉や、即興で生成された書き言葉を入力とする言語アプリケーションのための基盤技術として、読みにくい語順を持った文に対する高性能な係り受け解析技術の開発を推進した。具体的には、最終年度及び補助事業期間全体を通じて以下の項目を実施した。 (1)これまでに開発済みの語順整序・係り受け解析の同時実行手法を、節内部と節間の2段階に分けて適用する解析器を開発するため、読みにくい文に対する節の始境界検出手法を開発した。 (2)漸進的係り受け解析への応用を目的として、文節が入力されるごとに残存文長をRNNにより推定する機構を開発した。本成果はFIT2018、FIT2019、IPSJ82全国大会で奨励賞を受賞するなど、高い評価を受けた。また、漸進的係り受け解析の関連研究として、漸進的係り受け解析において未入力文節との構文的関係を同定する手法を開発した。 (3)人が漸進的に係り受け構造を把握する過程を分析し、その振舞に関する知見の獲得を試みた。その分析用データとして、作業者2名が漸進的係り受け解析を実行したデータを構築した。 (4)読みにくい文に対する高精度な係り受け解析を実現するための関連研究として、法令文に対する並列構造解析手法を開発した。本研究の成果は学術雑誌に採録された。 (5)読点と語順を考慮した係り受け解析を実現するための関連研究として、読みにくい語順の文に対応した読点挿入手法の開発に取り組んだ。読みにくい語順の文データを用いて読点挿入実験を実施し、問題点を整理した。さらに最終年度には、読点・語順・係り受けを同時実行するアルゴリズムの開発を行った。
|