2021 Fiscal Year Annual Research Report
Project/Area Number |
21H03497
|
Research Institution | Nagoya University |
Principal Investigator |
佐藤 理史 名古屋大学, 工学研究科, 教授 (30205918)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Keywords | 自然言語処理 / 発話文 / 表現文型 |
Outline of Annual Research Achievements |
本年度は、主に以下のことを行った。 (1)多様な発話文の自動合成の基盤となる『発話文表現文型辞書』の増補を行った。この辞書は、発話意図毎に、使用できる表現文型を整理した辞書で、増補により60種類の発話意図、計8055文型を収録するに至った。この辞書の最大の特徴は、それぞれの表現文型に「話し方特徴ベクトル」を付与している点にあるが、この特徴を見直し、6軸20種類に拡張した。さらに、文合成ツールHaoriBricks3との連携を容易にするために、表現文型の記述形式を見直した。 (2)話者の性格を反映した発話文を生成するシステムを実装した。このシステムは、話者の性格ベクトル(12要素)を入力すると、その話者が使用すると思われる表現文型とその確率を推定し、指定されたキーワードを含む文と結合して発話文を生成する。使用すると思われる表現文型の推定には、キャラクタデータベースを利用する。このデータベースには、25名のキャラクタのそれぞれに対して、性格ベクトルと7種類の発話意図における使用文型のリストの組を定義している。このデータを利用して、システムが扱う46種類の発話意図のうちの残りの発話意図に対して、使用文型リストを推定する。さらに、こうして拡張されたデータベースを利用して、与えられた任意の性格ベクトルを持つキャラクタに対し、46種類の発話意図のそれぞれにおけるそのキャラクタの使用文型リストを推定する。小規模な実験において、入力した性格を反映した発話文が生成できていることを確認した。 (3)小説発話文データベースの増強として、『化物語』を対象に、書き起こしたテキストのそれぞれの発話に話者情報を付与したコーパスを作成した。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
不十分ではあるが、性格を感じさせる発話文の生成を実現できたという点では、大きな進捗があったが、『発話文表現文型辞書』および発話文生成機構の両方において、多くの課題が残っている。また、今年度予定していた発話文解析機構については、ほとんど手がつけられなかった。そのため、全体としては若干遅れているという状態である。
|
Strategy for Future Research Activity |
『発話文表現文型辞書』の改訂・増補については、これまで同様、継続して取り組む。「話し方特徴」以外に、言語表現自体の特徴を付与することを検討する。発話文生成機構については、性格等の表現方法を再検討するとともに、表現文型を推定する方法を洗練させることに取り組む。発話文解析機構については、優先順位を下げ、余力があれば取り組むこととする。
|
Research Products
(2 results)