研究課題/領域番号 |
19K12191
|
研究機関 | 東京工科大学 |
研究代表者 |
岩下 志乃 東京工科大学, コンピュータサイエンス学部, 准教授 (00360503)
|
研究分担者 |
杉本 徹 芝浦工業大学, 工学部, 教授 (30277280)
伊藤 紀子 同志社大学, 文化情報学部, 准教授 (00391863)
林 篤司 公益財団法人かずさDNA研究所, 先端研究開発部, 特任研究員 (60777895)
|
研究期間 (年度) |
2019-04-01 – 2022-03-31
|
キーワード | 雑談対話システム / 個性 / 性格特性 |
研究実績の概要 |
本研究の目的は4つある.①対話における「個性」を分類できるようにすること,②深層学習に適した対話コーパスを構築すること,③個性を持つ雑談対話システムを構築すること,④個性を持つ雑談対話システムに対する印象や返答方法が個人によってどの程度異なるのかを検証すること,である.2020年度は,②③を実施することを予定していた.また,2019年度に完了しなかった①についても検討することとした. ②の対話コーパスの構築については,2019年度に実施した対話実験と同様の内容で,東京工科大学と芝浦工業大学の両大学で再度実験を実施し,対話ログと性格特性・社会的スキルのアンケートデータを収集した.データ数の目標は100名だったが,結果として合計39名のデータを収集した.収集した対話ログに対しては,破綻と対話行為のタグ付けを実施した.性格特性・社会的スキルのアンケートデータを利用しやすい形式にまとめたうえで,性格特性と社会的スキルのパラメータ値を計算したデータを作成した.これらのデータをまとめて,東京工科大学岩下研究室のWebサイト上に公開した. ③の雑談対話システムの構築については,雑談対話システムに利用するためのEncoder-Decoderモデルをコンピュータ上で構築した.モデルのテストとして,Twitterのツイートとリプライを75万対収集したものを学習データとして,あるツイートを入力した時に感情を付与したリプライを出力させた.対話が成立しているかどうかを評価したところ,約76%が「やや成立している」以上の評価を得ることができた.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
2020年度に実施予定としていたのは,概要で述べた目的②を完了するため,対話実験の実施と対話コーパスの作成を行うことと,目的①を完了するために,対話コーパスとアンケート結果の関係についての言語学的分析をおこなうこと,目的③である雑談対話システムの構築をおこなうことであった.目的②に関しては,目標の100名に届かなかったものの,39名のデータを収集し,2019年度と合わせて54名分のデータに対してタグ付けまで完了している.2021年度にも再度実験を行い,目標の100名に到達させる予定である.目的①については,データ数がまだ足りないため未完了である.目的③についてはテストプログラムを構築し,評価まで実施しているが,まだ対話コーパスが完成していないことから言語学的分析が進んでおらず実際の評価ができていない.以上のことから,2020年度はやや遅れていると評価した.
|
今後の研究の推進方策 |
2021年度は,2019~2020年度に実施した対話実験を引き続き実施し,対話ログとアンケートのデータを収集する.実験の被験者数の目標は100名である.対話ログに対して破綻と対話行為のタグ付けを実施し,対話コーパスを完成させる. 並行して,対話コーパスとアンケート結果の関係について言語学的に分析して,個性が反映される性格パラメータを絞り,個性ベクトルを構築する. 2020年度にテストしたseq2seqとEncoder-Decoderモデルを用いた雑談対話システムに対して,作成した対話コーパスを学習データとして入力する.Decoderに個性ベクトルを入力することにより,個性ベクトルに基づいた個性的な応答文が出力できるようにプログラムの設計を行う.また,出力結果を評価し,プログラムの修正を行う. 得られた結果について,原著論文としてまとめて学術雑誌に投稿する.
|
次年度使用額が生じた理由 |
新型コロナウィルスの影響で打ち合わせや国際会議への参加の旅費が掛からなかったことが最も大きな理由である.また,被験者実験の人数が想定よりも少なかったことで,人件費の支出が少なくなってしまった.次年度も国際会議への参加は難しいと考え,必要な物品への支出に切り替えることも検討する.人件費については,次年度は被験者を増やすことで予定通り支出することを計画している.
|