Project/Area Number |
21H03497
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Allocation Type | Single-year Grants |
Section | 一般 |
Review Section |
Basic Section 61030:Intelligent informatics-related
|
Research Institution | Nagoya University |
Principal Investigator |
佐藤 理史 名古屋大学, 工学研究科, 教授 (30205918)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Project Status |
Completed (Fiscal Year 2023)
|
Budget Amount *help |
¥15,990,000 (Direct Cost: ¥12,300,000、Indirect Cost: ¥3,690,000)
Fiscal Year 2023: ¥5,200,000 (Direct Cost: ¥4,000,000、Indirect Cost: ¥1,200,000)
Fiscal Year 2022: ¥5,330,000 (Direct Cost: ¥4,100,000、Indirect Cost: ¥1,230,000)
Fiscal Year 2021: ¥5,460,000 (Direct Cost: ¥4,200,000、Indirect Cost: ¥1,260,000)
|
Keywords | 自然言語処理 / 発話文 / 表現文型 / 口調エンコーダ / 口調ベクトル / 話者推定 / 発話生成 |
Outline of Research at the Start |
本研究では、話者の人物像を感じさせる発話文(会話を構成する文)を生成する機構を実現する。発話文は、特に文末表現において、地の文より多くのバリエーションが存在し、その部分に話者の特徴や個性、態度が顕著に現れる。本研究では、主に小説の会話文を対象に、次の3点を行う。(1) 文末表現の形式を表現文型として捉え、これを整理した辞書 (表現文型辞書) を作成する。(2) 表現文型辞書を利用した発話文生成機構を実現する。(3) 与えられた発話文の表現文型を同定する発話文解析機構を実現する。
|
Outline of Annual Research Achievements |
(1)口調ベクトルに基づく話者推定の改良:昨年度までに開発した口調エンコーダを中核とする、小説発話の話者推定システムの改良に取り組み、追加実験を行った。追加実験では、口調エンコーダの性能に関わるパラメータを明らかにするとともに、文エンコーダとして使用するモデルの違いによる性能の変化、未知の口調に対する性能などを調べた。これらをまとめた論文は受理され、2024年9月中旬に発刊される予定である。さらに、話者推定の前段となる、小説の登場人物の自動検出にも取り組んだ。 (2)口調弁別評価データセットの作成と口調エンコーダの評価:口調エンコーダの性能を評価するためのデータセットとして、19種類の口調タイプのそれぞれに対して45セリフを収録したデータセットを新たに作成した。さらに、口調エンコーダの改良に取り組み、文エンコーダ(事前学習済みBERT)に小説のセリフデータを用いた追加学習を施すことにより、口調弁別性能が向上することを明らかにした。19種類の中の2種類の口調タイプの平均弁別精度は、約90%である。 (3)キャラクタライズされた発話の生成:これまで作成してきた発話文表現文型辞書を利用して複数の発話候補を生成したのち、特定のキャラクタらしい発話を選択することで、発話を生成する機構を試作した。発話選択では、キャラクタの代表口調ベクトルと発話候補の口調ベクトルの類似度を計算し、その値が最大となる発話候補を選択する。発話候補生成にまだ課題は残っているが、キャラクタらしい発話の生成の枠組みは固まった。 (4)このほかに、実際の小説の発話文を対象に、発話意図と文末表現の分析を進めた。
|
Research Progress Status |
令和5年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
令和5年度が最終年度であるため、記入しない。
|
Report
(3 results)
Research Products
(11 results)