研究課題/領域番号 |
21K19819
|
研究種目 |
挑戦的研究(萌芽)
|
配分区分 | 基金 |
審査区分 |
中区分62:応用情報学およびその関連分野
|
研究機関 | 電気通信大学 |
研究代表者 |
稲葉 通将 電気通信大学, 人工知能先端研究センター, 准教授 (10636202)
|
研究期間 (年度) |
2021-07-09 – 2024-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
6,370千円 (直接経費: 4,900千円、間接経費: 1,470千円)
2023年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
2022年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
2021年度: 2,990千円 (直接経費: 2,300千円、間接経費: 690千円)
|
キーワード | 対話生成 / 対話モデル / 対話 / コンテンツ生成 / 知的対話システム |
研究開始時の研究の概要 |
情報伝達の形式として,対話形式を採用することは古今東西で行われてきた.例えば,古代ギリシャの哲学者プラトンの多くの著作は対話形式で書かれており,また,論語は孔子と弟子の間の対話形式となっている.その利点は話し言葉であるため,読者にとって理解しやすくなること,質問応答の形をとりやすく論理展開が明確になること,などが挙げられる.本研究では,ニュースや解説記事などの対話形式ではないテキストから,その内容をわかりやすく伝えるための対話形式テキストコンテンツを自動生成する技術開発を行う.
|
研究実績の概要 |
報伝達の形式として,対話形式を採用することは古今東西で行われてきた.例えば,古代ギリシャの哲学者プラトンの多くの著作は対話形式で書かれており,また,論語は孔子と弟子の間の対話形式となっている.最近でも,ネット上では対話形式で書かれた記事は多く書かれているほか,漫画を用いたもの(まんがでわかるシリーズ ほか),動画投稿サイトにおける「ゆっくり解説」など,その活用は様々なメディアに広がっている. 対話形式の利点は話し言葉であるため,理解しやすくなること,質問応答の形をとりやすく論理展開が明確になること,登場人物(特に質問者・学習者側)に自己を投影して読むことができること,等が挙げられる.しかし,特にテキストに関しては非対話形式で記述されたものがほとんどである.もちろん,対話形式は網羅的な記述に向かないことや,非対話形式と比較して文量が多くなるといった欠点も存在する.しかし,理解しやすさという観点から,文量が多いものや難解な非対話形式の文書を理解するための導入として有用である. 本年度は,非対話形式のデータとしてニュース記事を入力とし,対話を生成する深層学習のモデルの開発を昨年度から継続して行った.提案モデルは非対話形式のデータと対話形式のデータの両方を学習に用いるマルチソース学習に基づくモデルである.本研究の成果は人工知能学会 言語・音声理解と対話処理研究会にて発表を行い,若手優秀賞を受賞した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
モデルの構築と実験を行い,既存手法と比較して有意に性能が高いことを確認したものの,生成される対話の品質が想定していたものよりも低く,現状は十分ではなかったことから,さらなる検討が必要である.
|
今後の研究の推進方策 |
現状,提案モデルが期待した性能に達していないことから,近年発展が著しいChatGPTを始めとする大規模言語モデルを活用し,モデルの改良を行っていく.
|