研究課題/領域番号 |
19K12191
|
研究機関 | 東京工科大学 |
研究代表者 |
岩下 志乃 東京工科大学, コンピュータサイエンス学部, 准教授 (00360503)
|
研究分担者 |
杉本 徹 芝浦工業大学, 工学部, 教授 (30277280)
伊藤 紀子 同志社大学, 文化情報学部, 准教授 (00391863)
林 篤司 国立研究開発法人農業・食品産業技術総合研究機構, 農業ロボティクス研究センター, 特別研究員 (60777895)
|
研究期間 (年度) |
2019-04-01 – 2023-03-31
|
キーワード | 雑談対話システム / 個性 / 性格特性 |
研究実績の概要 |
本研究の目的は4つある.①対話における「個性」を分類できるようにすること,②深層学習に適した対話コーパスを構築すること,③個性を持つ雑談対話システムを構築すること,④個性を持つ雑談対話システムに対する印象や返答方法が個人によってどの程度異なるのかを検証すること,である.2021年度は,2020年度に完了しなかった②の実験を行い,その後タグ付けした②のコーパスを利用して①を実施し,その後に③と④を実施することを予定していた. ②の対話コーパスの構築については,2019,2020年度に実施した対話実験と同様の内容で,東京工科大学と芝浦工業大学の両大学で再度実験を実施し,対話ログと性格特性・社会的スキルのアンケートデータを収集した.2020年度に18名のデータを収集し,合計72名のデータを得た.収集した対話ログに対しては,これまでと同様に破綻と対話行為のタグ付けを実施した.このデータを,2021年度に東京工科大学岩下研究室のWebサイト上に公開したデータに追加して公開した. ①については,現状の72名の対話コーパスを分析し,対話に影響の大きいパラメータを複数抽出した.ただし,アンケートで取得した性格特性と,コーパスから受ける性格特性の印象に乖離があることがわかった.つまり,性格特性に紐づいた言語的特徴をそのまま対話システムに反映させても,その性格特性の印象を表現できないことになる.このことについては2022年度に引き続き検討しなければならない. ③の雑談対話システムの構築については,予定通りに進まず,個性を持たない雑談対話システムの構築と検証にとどまった.2022年度に延長して個性を持つシステムの構築と検証を実施することにした.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
4: 遅れている
理由
2021年度に実施予定としていたのは,概要で述べた目的②を完了するため,対話実験の実施と対話コーパスの作成を行うことと,目的①の分析を完了させること,さらに目的③④である雑談対話システムの構築と評価をおこなうことであった.目的②に関しては,目標の100名に届かなかったものの,2019,2020年度と合わせて72名分のデータに対してタグ付けまで完了している.2022年度にも再度実験を行い,目標の100名に到達させる予定である. 目的③についてはテストプログラムを構築し,評価まで実施しているが,目的①の分析結果を反映させるに至らなかった.以上のことから,当初は2021年度で完了する予定だった課題が遅れており,2022年度まで延長することとした.
|
今後の研究の推進方策 |
2022年度は,2019~2021年度に実施した対話実験を引き続き実施し,対話ログとアンケートのデータを収集する.実験の被験者数の目標は100名である.対話ログに対して破綻と対話行為のタグ付けを実施し,対話コーパスを完成させる. 2020年度にテストしたseq2seqとEncoder-Decoderモデルを用いた雑談対話システムに対して,作成した対話コーパスを学習データとして入力する.Decoderに個性ベクトルを入力することにより,個性ベクトルに基づいた個性的な応答文が出力できるようにプログラムの設計を行う.また,出力結果を評価し,プログラムの修正を行う. まずは収集したデータと,それを利用したテストプログラムについて,夏の学会で口頭発表を行う予定である.さらに得られた結果について,原著論文としてまとめて学術雑誌に投稿する予定である.
|
次年度使用額が生じた理由 |
新型コロナウィルスの影響で打ち合わせや国際会議への参加の旅費が掛からなかったことが最も大きな理由である.また,被験者実験の人数が想定よりも少なかったことで,人件費の支出が少なくなってしまった.研究が遅れていることも理由の一つである.次年度は,プログラミングやデータ整理のための人件費や,成果の投稿を積極的に行うための学会参加費や論文投稿費に使用する予定である.
|