2018 Fiscal Year Annual Research Report
Design and Implementation of a Japanese Text Generation Toolkit Modeled on Interlocking Bricks
Project/Area Number |
17K20028
|
Research Institution | Nagoya University |
Principal Investigator |
佐藤 理史 名古屋大学, 工学研究科, 教授 (30205918)
|
Project Period (FY) |
2017-06-30 – 2019-03-31
|
Keywords | テキスト生成 / 日本語生成 / 自然言語処理 / 発話表現辞書 / 発話生成 |
Outline of Annual Research Achievements |
本年度は、以下の研究を実施した。 (1)昨年度作成したHaoriBricksの保守を容易にするために、プログラムの整理と再実装を行い、全体のおおよそ80%のコードを刷新した。この過程で、システムの中核部分であるkernelモジュールとユーザーに提供する機能をまとめたbasicパッケージとを明確に分離し、見通しのよい構成を採用した。 (2)組み立てたブロックの内部構造を参照・変形できる汎用的な機構を導入し、これを用いて、多くの総称ブロックを実装した。たとえば、ブロック「丁寧」は、述語が動詞の場合は「ます」を付与し、述語が形容詞の場合は「です」を付与し、述語が形容動詞や判定詞の場合は「だ」を「です」に変換する、のように、対象述語に合わせた変換を実現する。 (3)発話文を生成するために、発話表現文書を整備した。この辞書は、74種類の発話意図のそれぞれに対して、使用できる表現文型を列挙した辞書である。この辞書をHaoriBricksから利用できるようにした。これにより、発話内容、発話意図、話し方の特徴の3つの入力から、発話文を生成することが可能となり、複数の話し手の発話文のスタイルをコントロールすることが容易となった。 (4)HaoriBricksを利用して、テンプレートに基づく単文生成ツールHaoriTemplateを実装した。このツールでは、最小限の付加情報を記述したテンプレート文字列を、内部でHaoriBricksコードに変換するため、テンプレートによる生成を行なった後でも、たとえば丁寧体への変換など変形が可能である。複文の作成も、それぞれテンプレートで生成した単文をHaoriBricksの機能を用いて組み合わせることで、容易に実現できる。
|