組合せ範疇文法(Combinatory categorial grammar)と呼ばれる形式文法の枠組みに基づいて,形式的な推論を可能とするレベルの精緻な意味表示を導出できる日本語文法・辞書の記述を行うとともに,辞書の記述と対応する用例の収集を進めた.また,語彙および語の用法を半自動的に収集するための基礎技術でもある構文解析器の高性能化を行った.特に最終年度は,数学テキストの解析のために,数式を含むテキストに対する構文解析技術の高度化に取り組んだ.具体的には,LaTeX あるいは MathML の形式で表現されたテキスト中の数式を解析して,その意味構造および統語カテゴリを推定したのち,数式の周囲の語の用法との整合性をとりながら文全体の構文・意味解析を行う技術の高度化を行った.これにより,LaTeX による数式記述を含む大量の数学テキストを自動的に解析することが可能になった.また,文境界を越え,テキスト全体の整合的な解析を行うためにゼロ照応を含む照応表現の指示対象を同定する処理についての研究を行った.テキスト全体に対する正確な意味表示を得るためには,これまで広く研究が行われてきたモノ(entity)を指す照応表現の解析に加え,これまでの研究の蓄積が少ないコト(命題)を指示する表現の解析が必要になる.この研究では前者に加え,後者についても研究を行い,文書構造(例:「(1)の条件」)や後方参照(例:「以下の条件」)などいくつかのタイプのコトを指す指示表現の解析技術を開発した.以上の成果について,国際学会における口頭発表および招待講演,国内学会におけるチュートリアル講演などを通じ報告した.
|