日本語をコンピュータで処理するための日本語文法の徹底的な形式化が本研究の目的であるが、本年度は、日本語の構文解析のための構文規則の形式化が主な研究課題であった。ただ、前年度に行った形態素解析から構文解析につなぐために、形態素解析に改良を加えた。その主な点は、 1.最長一致法を取り入れているため後続の語の一部を前の語が取り組んでしまう点を、その危険性がある文字が来たとき、その時点で再度辞書引きを行うことで、正しい解析ができるようにしたこと。 2.同形の語に異なる形態素の組み合わせがある場合、別々の語として解析していたが、この方法は構文解析に負担をかけるため、このような組み合わせは、構文解析の規則に組み入れ、同一の語形を構文解析で多様に処理するようにしたこと。である。 さらに、データのための文を5千追加し、前年度の表層格による文型および動詞、形容詞、形容動詞、副詞、名詞、接辞の下位分類を行い、さらに、意味要素を加味した深層の格を記述する格フレームを表層格、名詞の下位分類の記述を行いつつある。ただ、上記の作業は、大量のデータの分析であり、コンピュータのプログラムによる分類ができず、ほとんど手作業であるため、当初の予定より若干遅れているが、なるべくプログラムによる作業を増やすことで、鋭意処理中である。 また、解析のコンピュータ・プログラムを作成し、二年間の文データによる検証は順調に進んでいる。
|