• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

オンライン講義の学びを活性化するソーシャルアノテーションに基づく講義要約システム

Research Project

Project/Area Number 21K13641
Research Category

Grant-in-Aid for Early-Career Scientists

Allocation TypeMulti-year Fund
Review Section Basic Section 09070:Educational technology-related
Research InstitutionAnan National College of Technology

Principal Investigator

太田 健吾  阿南工業高等専門学校, 創造技術工学科, 准教授 (80712801)

Project Period (FY) 2021-04-01 – 2025-03-31
Project Status Granted (Fiscal Year 2023)
Budget Amount *help
¥4,680,000 (Direct Cost: ¥3,600,000、Indirect Cost: ¥1,080,000)
Fiscal Year 2023: ¥1,690,000 (Direct Cost: ¥1,300,000、Indirect Cost: ¥390,000)
Fiscal Year 2022: ¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000)
Fiscal Year 2021: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
Keywords音声認識 / 音声要約 / ソーシャルアノテーション / 教育工学 / オンライン講義 / 講義コンテンツ
Outline of Research at the Start

本研究では、オンライン講義の動画やライブ配信に付与された学生のリアクション(投稿コメントや「いいね」など)と、講師の作成した講義コンテンツ(講義スライドやレジュメなど)を学習データに活用することで、講義音声の音声認識(自動書き起こし)と自動要約(重要な部分の自動抽出)を高精度化する。音声認識の結果を講義動画の字幕として提示したり、自動要約の結果を学生の復習用の教材として提示することにより、オンライン講義コンテンツの再利用性を高め、学生の学びを活性化する。

Outline of Annual Research Achievements

本研究では、オンライン講義の動画やライブ配信に付与された学生のリアクション(投稿コメントや「いいね」など)と、講師の作成した講義コンテンツ(講義スライドやレジュメなど)を学習データに活用することで、講義音声の音声認識(自動書き起こし)と自動要約(重要な部分の自動抽出)を高精度化することを目指している。2023年度は、以下の研究内容を実施した。
【内容1】本研究の対象とする講義音声のような自由発話では、フィラーや言い淀みをはじめとする非流暢的音響特徴が音声認識における誤認識の原因となる。このような話し言葉音声に対する音声認識を高精度化するために、昨年度に提案した、非流暢ラベルを大規模言語モデルによって疑似的に挿入する手法に基づいて、話し言葉の特性と講義等に頻出する専門用語等を同時に考慮できる音声認識用言語モデルを構築し、これをEnd-to-End型音声認識システムにおいてShallow Fusionによって音響モデルと併用することで、学会講演音声を高精度に認識できることを示した。
【内容2】オンライン講義の動画やライブ配信において、視聴者のリアクション(投稿コメント)を模擬する言語生成モデルを構築した。提案モデルでは、動画や配信の発話内容をOpenAI Whisperによって音声認識し、また、音声基盤モデルに基づく感情認識モデルによって発話に込められた感情を認識する。両者の情報を入力としてファインチューニングされたGPT-NeoXにより、視聴者の投稿コメントを模擬的に生成することができた。
【内容3】講義音声から音響特徴と言語特徴に基づいて重要箇所を検出する要約モデルを構築した。wav2vec 2.0およびword2vecによって抽出された音声・言語の埋め込み表現を入力とする深層学習モデルにより、視聴者が多く視聴すると思われる重要箇所を検出することができる可能性を確認した。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

【進捗1】オンライン講義の講義音声を対象とする音声認識では、フィラーや言い淀みといった話し言葉特有の問題と、専門性の高い発話内容(専門用語の頻出や数式の読み上げなど)が大きな問題となる。昨年度は、これまでに提案してきた、これら2つの問題に対応する手法をさらに発展させ、有効性を示すことができた。これらの成果は、それぞれ査読付き国際会議で発表することができた。
【進捗2】オンライン講義の動画やライブ配信において、視聴者のリアクション(投稿コメント)は重要な情報となる。こうした視聴者による投稿コメントを疑似的に言語生成システムを音声・言語基盤モデルに基づいて構築し、実際のコメントをある程度模擬することができることを確認した。この成果は査読付き国内学会で発表することができた。
【進捗3】講義音声から音響特徴と言語特徴に基づいて重要箇所を検出する要約モデルを構築し、実際の教育動画コンテンツに対して、視聴者が多く視聴すると思われる重要箇所を検出することができる可能性を確認した。この成果は査読付き国内学会で発表することができた。

以上より、本研究の最終目標となるシステムのベースラインや基盤が整った状態にあることから、おおむね順調に進展していると考えられる。

Strategy for Future Research Activity

今後は、これまでに構築したソーシャルアノテーションを模擬するモデルや音声要約モデルをさらに発展させ、最終的な提案システムの構築と評価を目指していく。
ソーシャルアノテーションを模擬するモデルについては、投稿コメント以外の「いいね」等のリアクションも模擬し、コメントと「いいね」の予測をマルチタスク学習によって同時に最適化する手法についても検討を行う。また、Web上の教育コンテンツを大規模にクローリング等によって収集し、それらに対するリアクションのデータを活用して、モデルの高精度化を図る。
音声要約モデルについては、前述のソーシャルアノテーション生成モデルを学習データのデータ拡張に活用し、また、より大規模な音声言語基盤モデルとして、日本語に特化したGPT等の言語基盤モデルやHuBERT等の音声基盤モデルをベースとすることで、さらなる高精度化を図っていく。

Report

(3 results)
  • 2023 Research-status Report
  • 2022 Research-status Report
  • 2021 Research-status Report
  • Research Products

    (19 results)

All 2023 2022 2021

All Presentation (19 results) (of which Int'l Joint Research: 6 results)

  • [Presentation] Combining multiple end-to-end speech recognition models based on density ratio approach2023

    • Author(s)
      Hojo Keigo、Mori Daiki、Wakabayashi Yukoh、Ohta Kengo、Ogawa Atsunori、Kitaoka Norihide
    • Organizer
      2023 Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC)
    • Related Report
      2023 Research-status Report
    • Int'l Joint Research
  • [Presentation] Language modeling for spontaneous speech recognition based on disfluency labeling and generation of disfluent text2023

    • Author(s)
      Horii Koharu、Ohta Kengo、Nishimura Ryota、Ogawa Atsunori、Kitaoka Norihide
    • Organizer
      2023 Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC)
    • Related Report
      2023 Research-status Report
    • Int'l Joint Research
  • [Presentation] Wav2vecを用いた音声解析に基づく動画の自動要約手法に関する研究2023

    • Author(s)
      倉渕光希, 太田健吾
    • Organizer
      計測自動制御学会四国支部学術講演会
    • Related Report
      2023 Research-status Report
  • [Presentation] 大規模言語モデルに基づく動画配信における視聴者の立場で応答する雑談対話モデルの構築と評価2023

    • Author(s)
      中田東吾, 太田健吾
    • Organizer
      計測自動制御学会四国支部学術講演会
    • Related Report
      2023 Research-status Report
  • [Presentation] 自発的発話認識のためのBERTによる非流暢文生成に基づく言語モデリング2023

    • Author(s)
      堀井 こはる,太田 健吾,西村 良太,小川 厚徳,北岡 教英
    • Organizer
      日本音響学会講演論文集
    • Related Report
      2022 Research-status Report
  • [Presentation] Implicit language information replace method in Japanese encoder-decode ASR model2022

    • Author(s)
      Daiki Mori, Kengo Ohta, Ryota Nishimura, Norihide Kitaoka
    • Organizer
      The International Conference on Advanced Informatics: Concepts, Theory and Applications
    • Related Report
      2022 Research-status Report
    • Int'l Joint Research
  • [Presentation] End-to-End Spontaneous Speech Recognition Using Disfluency Labeling2022

    • Author(s)
      Koharu Horii, Meiko Fukuda, Kengo Ohta, Ryota Nishimura, Atsunori Ogawa, Norihide Kitaoka
    • Organizer
      Interspeech
    • Related Report
      2022 Research-status Report
    • Int'l Joint Research
  • [Presentation] End-to-End非流暢整形音声認識システムの対話音声による評価2022

    • Author(s)
      堀井こはる, 福田芽衣子, 太田健吾, 西村良太, 小川厚徳, 北岡教英
    • Organizer
      日本音響学会講演論文集
    • Related Report
      2022 Research-status Report
  • [Presentation] ドメイン外音響情報で補強したEncoder-Decoder音声認識モデルの設計2022

    • Author(s)
      森大輝, 太田健吾, 西村良太, 北岡教英
    • Organizer
      日本音響学会講演論文集
    • Related Report
      2022 Research-status Report
  • [Presentation] タスク外音響情報を付加したEnd-to-End音声認識モデルの設計2022

    • Author(s)
      森 大輝,太田 健吾,西村 良太,小川厚徳,北岡 教英
    • Organizer
      日本音響学会春季講演論文集,2-3Q-2
    • Related Report
      2021 Research-status Report
  • [Presentation] 非流暢ラベルを用いた言い淀み整形End-to-End音声認識2022

    • Author(s)
      堀井 こはる,福田 芽衣子,太田 健吾,西村 良太,小川厚徳,北岡 教英
    • Organizer
      日本音響学会春季講演論文集,1-3-5
    • Related Report
      2021 Research-status Report
  • [Presentation] 言い淀みを考慮したEnd-to-End音声認識2021

    • Author(s)
      堀井 こはる,福田 芽衣子,太田 健吾,西村 良太,北岡 教英
    • Organizer
      第19回情報学ワークショップ(WiNF2021),S-5-2
    • Related Report
      2021 Research-status Report
  • [Presentation] Encoder-Decoder音声認識モデルにおける暗黙的言語情報の置換法2021

    • Author(s)
      森 大輝,太田 健吾,西村 良太,北岡 教英
    • Organizer
      第19回情報学ワークショップ(WiNF2021),S-5-5
    • Related Report
      2021 Research-status Report
  • [Presentation] Encoder-Decoder音声認識モデルにおける暗黙的言語情報の置換法2021

    • Author(s)
      森 大輝,太田 健吾,西村 良太,小川 厚徳,北岡 教英
    • Organizer
      日本音響学会秋季講演論文集,1-3-1
    • Related Report
      2021 Research-status Report
  • [Presentation] 言い淀みを考慮した自由発話のEnd-to-End音声認識2021

    • Author(s)
      堀井 こはる,福田 芽衣子,太田 健吾,西村 良太,北岡 教英
    • Organizer
      日本音響学会講演論文集,1-3-3
    • Related Report
      2021 Research-status Report
  • [Presentation] End-to-end音声認識モデルにおける暗黙的言語情報の置換法2021

    • Author(s)
      森大輝,太田健吾,西村良太,小川厚徳,北岡教英
    • Organizer
      音学シンポジウム
    • Related Report
      2021 Research-status Report
  • [Presentation] 言い淀みラベル付けによる非流暢発話のEnd-to-End音声認識2021

    • Author(s)
      堀井こはる,福田芽衣子,太田健吾,西村良太,北岡教英
    • Organizer
      音学シンポジウム
    • Related Report
      2021 Research-status Report
  • [Presentation] Advanced language model fusion method for encoder-decoder model in Japanese speech2021

    • Author(s)
      Daiki Mori,Kengo Ohta,Ryota Nishimura,Atsunori Ogawa,Norihide Kitaoka
    • Organizer
      Proc. APSIPA ASC,pp. 503-510
    • Related Report
      2021 Research-status Report
    • Int'l Joint Research
  • [Presentation] End-to-end spontaneous speech recognition using hesitation labeling2021

    • Author(s)
      Koharu Horii,Meiko Fukuda,Kengo Ohta,Ryota Nishimura,Atsunori Ogawa,Norihide Kitaoka
    • Organizer
      Proc. APSIPA ASC,pp. 1077-1081
    • Related Report
      2021 Research-status Report
    • Int'l Joint Research

URL: 

Published: 2021-04-28   Modified: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi