本年度は以下のことを行なった。 (1)日本語の文末述語を構成する要素の整理を進めた。文末述語は核となる述語(述語核)に0個以上の機能語が接続したものと捉える。昨年度作成した機能語リストを見直し、最終的に、助詞137語、判定詞1語、助動詞113語、述語接尾辞74語、複合辞301件からなるリストを完成させた。これらの機能語に対して活用型と接続型(どのような活用形形式に接続するか)の情報を定義してあり、かつ、日本語文合成ツールHaoriBricks3のブリックとして定義してある。さらに、話し言葉にみられる、いわゆる音変化に対応するために、39個の音変化コマンドをHaoriBrick3のブリックとして定義した。述語核を除く文末述語の形式のほとんどは、これらの組み合わせで表現できるため、HaoriBricks3で生成可能となった。これにより、本研究の目標の一つである「日本語の文末述語の生成」が、ほぼ達成された。 (2)文末述語生成を支えるツールHaoriBricks3のマニュアルの整備を進めた。マニュアルは、種類別にブリックを分類した「ブリック分類編」33ページと、あいうえお順にブリックを並べた「ブリック総索引」41ページから構成される。これらのマニュアルの整備により、HaoriBricks3のリリースの準備が整いつつある。 (3)日本語文末解析ツールPanzerの再実装および改良を進めた。再実装では、これまでのプログラムコードを整理し、処理のモジュール化を進め、異なる形態素解析システムを使えるようなアーキテクチャを採用した。さらに、処理過程のステップ化を進め、出力をどのレベルまで正規化するかを制御できる方式とし、これに対応するために、HaoriBricks3に新たなブリックを追加した。新たなPanzer2は、動作確認には至ったが完成には至らなかったため、今後も改良を継続する予定である。
|