2022 Fiscal Year Research-status Report
非対話形式のテキストを用いた対話形式コンテンツの生成
Project/Area Number |
21K19819
|
Research Institution | The University of Electro-Communications |
Principal Investigator |
稲葉 通将 電気通信大学, 人工知能先端研究センター, 准教授 (10636202)
|
Project Period (FY) |
2021-07-09 – 2024-03-31
|
Keywords | 対話生成 |
Outline of Annual Research Achievements |
報伝達の形式として,対話形式を採用することは古今東西で行われてきた.例えば,古代ギリシャの哲学者プラトンの多くの著作は対話形式で書かれており,また,論語は孔子と弟子の間の対話形式となっている.最近でも,ネット上では対話形式で書かれた記事は多く書かれているほか,漫画を用いたもの(まんがでわかるシリーズ ほか),動画投稿サイトにおける「ゆっくり解説」など,その活用は様々なメディアに広がっている. 対話形式の利点は話し言葉であるため,理解しやすくなること,質問応答の形をとりやすく論理展開が明確になること,登場人物(特に質問者・学習者側)に自己を投影して読むことができること,等が挙げられる.しかし,特にテキストに関しては非対話形式で記述されたものがほとんどである.もちろん,対話形式は網羅的な記述に向かないことや,非対話形式と比較して文量が多くなるといった欠点も存在する.しかし,理解しやすさという観点から,文量が多いものや難解な非対話形式の文書を理解するための導入として有用である. 本年度は,非対話形式のデータとしてニュース記事を入力とし,対話を生成する深層学習のモデルの開発を昨年度から継続して行った.提案モデルは非対話形式のデータと対話形式のデータの両方を学習に用いるマルチソース学習に基づくモデルである.本研究の成果は人工知能学会 言語・音声理解と対話処理研究会にて発表を行い,若手優秀賞を受賞した.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
モデルの構築と実験を行い,既存手法と比較して有意に性能が高いことを確認したものの,生成される対話の品質が想定していたものよりも低く,現状は十分ではなかったことから,さらなる検討が必要である.
|
Strategy for Future Research Activity |
現状,提案モデルが期待した性能に達していないことから,近年発展が著しいChatGPTを始めとする大規模言語モデルを活用し,モデルの改良を行っていく.
|
Causes of Carryover |
モデルの構築に時間がかかっており,実験のためのデータ収集費用等を使用できなかったため,次年度に使用する.
|
Research Products
(2 results)