2021 Fiscal Year Annual Research Report
日本語述語形式の体系的整理に基づく文末述語解析・生成システムの実現
Project/Area Number |
20K21809
|
Research Institution | Nagoya University |
Principal Investigator |
佐藤 理史 名古屋大学, 工学研究科, 教授 (30205918)
|
Project Period (FY) |
2020-07-30 – 2022-03-31
|
Keywords | 自然言語処理 / 機能語 / 文末述語生成 / 文末述語解析 |
Outline of Annual Research Achievements |
本年度は以下のことを行なった。 (1)日本語の文末述語を構成する要素の整理を進めた。文末述語は核となる述語(述語核)に0個以上の機能語が接続したものと捉える。昨年度作成した機能語リストを見直し、最終的に、助詞137語、判定詞1語、助動詞113語、述語接尾辞74語、複合辞301件からなるリストを完成させた。これらの機能語に対して活用型と接続型(どのような活用形形式に接続するか)の情報を定義してあり、かつ、日本語文合成ツールHaoriBricks3のブリックとして定義してある。さらに、話し言葉にみられる、いわゆる音変化に対応するために、39個の音変化コマンドをHaoriBrick3のブリックとして定義した。述語核を除く文末述語の形式のほとんどは、これらの組み合わせで表現できるため、HaoriBricks3で生成可能となった。これにより、本研究の目標の一つである「日本語の文末述語の生成」が、ほぼ達成された。 (2)文末述語生成を支えるツールHaoriBricks3のマニュアルの整備を進めた。マニュアルは、種類別にブリックを分類した「ブリック分類編」33ページと、あいうえお順にブリックを並べた「ブリック総索引」41ページから構成される。これらのマニュアルの整備により、HaoriBricks3のリリースの準備が整いつつある。 (3)日本語文末解析ツールPanzerの再実装および改良を進めた。再実装では、これまでのプログラムコードを整理し、処理のモジュール化を進め、異なる形態素解析システムを使えるようなアーキテクチャを採用した。さらに、処理過程のステップ化を進め、出力をどのレベルまで正規化するかを制御できる方式とし、これに対応するために、HaoriBricks3に新たなブリックを追加した。新たなPanzer2は、動作確認には至ったが完成には至らなかったため、今後も改良を継続する予定である。
|