2022 年度実績報告書

オンライン授業支援のためのバーチャル・クラスメートの開発

研究課題

研究課題/領域番号	21H00895
配分区分	補助金
研究機関	東北大学
研究代表者	伊藤彰則東北大学, 工学研究科, 教授 (70232428)
研究分担者	塩入諭東北大学, 電気通信研究所, 教授 (70226091) 能勢隆東北大学, 工学研究科, 准教授 (90550591)
研究期間 (年度)	2021-04-01 – 2026-03-31
キーワード	オンライン授業 / 音声対話 / 対話エージェント / 感情推定 / 重要文推定 / 表情生成
研究実績の概要	このプロジェクトでは、オンライン授業、特にオンデマンド型講義に関して、受講者と対話しながら講義への集中と内容の理解を促す音声対話エージェントを開発することが目標である。そのための課題のうち、仮想エージェントシステムの作成、講義の重要箇所の推定、学習者の注意状態の推定の３つの研究を推進した。それぞれの概要は以下の通りである。１．仮想エージェントは、Unity、UnrealEngine、Azure CognitiveServiceの３つを組み合わせて作成した。ユーザの表情から感情認識モデルによって感情を推定し、またユーザの音声入力の認識結果からデータベースを検索して回答文を選択する。その際に、ユーザの感情と回答文のセンチメント分析結果を組み合わせてエージェントの表情を推定し、これにあわせてエージェントに表情をつけることができた。２．講義の重要箇所の推定として、従来の文単位要約モデルを使って重要文の推定を行い、さらに音声特徴を組み合わせることの効果について検証した。いくつかのモデルを組み合わせて評価を行った結果、音声を組み合わせることの効果はそれほど高くなかった。また、講義を行う教員によって傾向が異なるので、最終的に一つのモデルで推定ができるのかどうかを含めて今後検討が必要である。３．集中度の推定にはOpenFaceを使い、視線方向とまばたきによる集中度の推定を行った。また、スマートウォッチを利用した心拍数などと集中度の関連を調べた。今回の実験では実験参加者が少なかったため、今後データを増やして実験を続ける必要がある。
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由仮想エージェントの開発は概ね終了した。今後は評価とブラッシュアップを行っていく必要がある。現状ではまだ表情生成やリップシンクがどの程度自然に見えるかの評価が特に必要である。また、今回はオンライン講義に関する対話をまだ実装しておらず、絵画に関する対話を用意した。オンライン講義の重要箇所推定については、データを増やして評価を行っている。その結果、講演者による重要箇所のキューの違いなど、昨年度よりもさらに詳しい分析が可能になった。ただし、推定精度はまだ高くないため、今後の検討が必要になる。受講者の集中度推定は、まだ着手したところであり、これから詳しい分析が必要になる。同様に、エージェントの動作生成も現在着手したところである。
今後の研究の推進方策	今年度は、昨年度の検討ををさらに進めて、システムの完成度を高める。１．仮想エージェントは、Unity、UnrealEngine、Azure CognitiveServiceの３つを組み合わせて作成しているが、表情生成をAzureのサービスに頼っており、自然性が十分でない。今年度はより自然な表情と動きの生成のためのモデルを開発するとともに、エージェントに実装して評価実験を行う。さらに、言語生成にLLMを利用することを検討する。２．講義の重要箇所の推定として、従来の文単位要約モデルを使って重要文の推定を行い、さらに音声特徴を組み合わせることの効果について検証した。今年度は、重要文推定について新たにモデルを開発し、従来の要約ベースの手法との比較を行う。３．集中度の推定にはOpenFaceを使い、視線方向とまばたきによる集中度の推定を行った。しかしこれでは十分な制度が得られなかったため、スマートウォッチを利用した心拍数などと集中度の関連を調べる。最終的にはスマートウォッチを装着して講義を受講することは現実的ではないので、画像から同等の情報を得る方法について検討する。すでにカメラ画像から心拍数などを推定する方法は提案されているので、これを実装してどこまで使えるか検証を行う。

研究成果
(6件)

すべて 2023 2022

すべて雑誌論文 (1件) (うち査読あり 1件) 学会発表 (5件) (うち国際学会 1件)

[雑誌論文] Combination of deep-learning-based audio separation and speech enhance-ment for noise reduction of extracted signal from polyphonic music2022
- 著者名/発表者名
  Soichiro Kobayashi, Takashi Nose, Akinori Ito
- 雑誌名
  
  Proceedings of International Congress on Acoustics
  
  巻: - ページ: -
- 査読あり
[学会発表] モノローグ発話における音声のパワーと口形の関係の調査2023
- 著者名/発表者名
  川西翔貴, 伊藤彰則, 千葉祐弥, 能勢隆
- 学会等名
  日本音響学会2023年春季研究発表会
[学会発表] オンライン講義における生体情報に基づく集中度推定に関する研究2023
- 著者名/発表者名
  遠藤雄飛, 伊藤彰則, 能勢隆
- 学会等名
  第388回音響工学研究会
[学会発表] 対話における非発話時の口唇の動きに関する研究2023
- 著者名/発表者名
  川西翔貴, 伊藤彰則, 千葉祐弥, 能勢隆
- 学会等名
  第388回音響工学研究会
[学会発表] 対話時における話者の動作に関する研究2023
- 著者名/発表者名
  伊藤遥稀, 伊藤彰則, 能勢隆
- 学会等名
  第388回音響工学研究会
[学会発表] A Comparison of Key Sentence Estimation Methods for On-Demand Lectures Using Text Summarization Techniques and Prosodic Information2022
- 著者名/発表者名
  Miki Takeuchi, Akinori Ito, Takashi Nose
- 学会等名
  International Workshop on Emerging ICT
- 国際学会

2022 年度 実績報告書

オンライン授業支援のためのバーチャル・クラスメートの開発

研究代表者

伊藤 彰則 東北大学, 工学研究科, 教授 (70232428)

現在までの達成度 (区分)

理由

研究成果

[雑誌論文] Combination of deep-learning-based audio separation and speech enhance-ment for noise reduction of extracted signal from polyphonic music2022

著者名/発表者名

雑誌名

[学会発表] モノローグ発話における音声のパワーと口形の関係の調査2023

著者名/発表者名

学会等名

[学会発表] オンライン講義における生体情報に基づく集中度推定に関する研究2023

著者名/発表者名

学会等名

[学会発表] 対話における非発話時の口唇の動きに関する研究2023

著者名/発表者名

学会等名

[学会発表] 対話時における話者の動作に関する研究2023

著者名/発表者名

学会等名

[学会発表] A Comparison of Key Sentence Estimation Methods for On-Demand Lectures Using Text Summarization Techniques and Prosodic Information2022

著者名/発表者名

学会等名

2022 年度実績報告書

伊藤彰則東北大学, 工学研究科, 教授 (70232428)