Automatic Multilingual Subtitling of Lecture Videos Towards University Globalization

Research Project

Project/Area Number	20K03120
Research Category	Grant-in-Aid for Scientific Research (C)
Allocation Type	Multi-year Fund
Section	一般
Review Section	Basic Section 09070:Educational technology-related
Research Institution	Kyushu University (2022-2023) Kyoto University (2021) The University of Tokyo (2020)
Principal Investigator	美馬秀樹九州大学, 未来人材育成機構, 特任教授 (30359658)
Co-Investigator(Kenkyū-buntansha)	増田勝也東京大学, 大学総合教育研究センター, 特任助教 (20512114) 小松祐美東京大学, 大学総合教育研究センター, 学術専門職員 (50792511)
Project Period (FY)	2020-04-01 – 2025-03-31
Project Status	Granted (Fiscal Year 2023)
Budget Amount *help	¥4,290,000 (Direct Cost: ¥3,300,000、Indirect Cost: ¥990,000) Fiscal Year 2022: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000) Fiscal Year 2021: ¥1,690,000 (Direct Cost: ¥1,300,000、Indirect Cost: ¥390,000) Fiscal Year 2020: ¥1,690,000 (Direct Cost: ¥1,300,000、Indirect Cost: ¥390,000)
Keywords	自動字幕付与 / 音声認識 / 機械翻訳 / 音声翻訳 / オンライン講義 / 教育DX / 科目ナンバリング / 可視化 / トピック推定 / 文書分類 / 対訳コーパス / 講義ビデオコーパス / 書き起こし / アノテーション / 多言語字幕付与 / カット自動編集 / トピック分割 / 多言語字幕付与システム / 精度向上 / 実現可能性 / 多言語音声翻訳 / 字幕付与 / 講義ビデオ
Outline of Research at the Start	教育のグローバル化という観点から時間・場所・個人を問わず“いつでも、どこでも、だれにでも”同等の教育の機会を提供することは非常に重要である。これには単純に普段の講義映像を撮影して公開するのではなく、映像に対して文字情報の付与や適切な編集、内容の提示など、付加的情報を併せて公開することが重要である。本研究では、まず講義映像を対象とした音声認識・自動翻訳システムの研究開発を行い高精度な多言語字幕を作成可能なシステムを開発する。また音声認識結果を利用したトピックの抽出を行いトピックによる映像のチャプター分割や検索を可能とすることで、近年、注目されているマイクロコンテンツと同様のアクセス性を持たせる。
Outline of Annual Research Achievements	“いつでも，どこでも，だれにでも”同等の教育の機会を提供することは非常に重要である．国連サミットにて採択されたSDGsにおいても，「質の高い教育をみんなに」は，今後の持続可能な社会における重要な政策目標の一つとなっている．また，海外からの留学性や教員も利用することを考慮すると，字幕に対して翻訳を行うことも必要な要素である．講義映像が短時間で少量であれば人手で行うことも可能であるが，一般に高コストである。そこで映像音声に対して自動的に音声認識を行い，その結果を字幕として付与する研究開発が行われている．しかしながら，音声認識の精度は年々向上してはいるものの，そのまま字幕として使用するには未だ十分な精度とは言い難い．特に，本研究で対象とする高等教育での講義映像の音声には専門用語が多く含まれており，認識できない用語があるのに加え，字幕として利用するためには同音異義語も正しく漢字へと変換することが必要となるが、これには講義で話されているテキストを大量に収集し、言語モデルを再構成することが望ましい。令和5年度には、引き続きサイバー大学より講義ビデオのご提供をいただき、収集した約100時間分の講義ビデオに対し、情報通信研究機構（NICT）との共同により音声テキストデータの抽出を進めた。音声翻訳の精度向上のためのデータとして利用し、実際の講義ビデオに適用することで、リアルタイムの字幕付与に関して、実用に耐えうる品質となることを確認した。一方で、講義に係るテキストを対象に、自然言語処理、及び機械学習による分析を行うことで、講義へのトピックの自動付与、講義の自動分類等が行えるプログラムを開発し、精度の検証を行っているところである。本プログラムにより、研究課題である、多言語に対する言語処理のみならず、科目ナンバリングの自動付与や、カリキュラムの自動構成のような高度なタスクへの応用も期待される。
Current Status of Research Progress	Current Status of Research Progress 3: Progress in research has been slightly delayed. Reason COVID-19の影響により、十分な時間が確保できず、当初、計画をしていた予定より若干、研究の進行が遅れる結果となった。なお、本理由により、研究期間の再延長を申請し、受理されている状態である。
Strategy for Future Research Activity	今後は、これまでに作成した講義音声コーパスを利用し、音声モデル、言語モデルの再学習を行うことで、音声認識の精度を向上するとともに、音声字幕を付与した講義ビデオ再生が行えるシステムの開発や、機械翻訳を統合した自動翻訳字幕付与のシステムの構築と実験評価を行うことを目指す。併せて、開発した言語処理プログラムを様々な教育関連テキストに適用することで、より高度な教育支援環境の実現を目指す。

Report

(4 results)

Research Products
(15 results)

All 2023 2022 2021 2020

All Journal Article (3 results) (of which Peer Reviewed: 1 results, Open Access: 1 results) Presentation (12 results) (of which Invited: 8 results)

[Journal Article] 九州大学におけるカリキュラムマップ・システムの構築と学修成果の可視化2023
- Author(s)
  美馬秀樹、深堀聰子
- Journal Title
  
  第51回可視化情報シンポジウム
  
  Volume: -
- Related Report
  2023 Research-status Report
[Journal Article] 自然言語処理と可視化を利用した履修選択支援システムの実用化2020
- Author(s)
  美馬秀樹
- Journal Title
  
  情報処理学会論文誌（コンピュータと教育）
  
  Volume: Vol.6 No.2 Pages: 38-51
- NAID
  170000181987
- Related Report
  2020 Research-status Report
- Peer Reviewed / Open Access
[Journal Article] 自動分類の応用可能性――大学カリキュラムの可視化・比較へのNDCの活用実験2020
- Author(s)
  増田勝也, 美馬秀樹
- Journal Title
  
  図書館がつなぐアジアの知
  
  Volume: 分類法から考える,Ｕ－ＰＡＲＬ（編） Pages: 163-178
- Related Report
  2020 Research-status Report
[Presentation] AIと教育DX2023
- Author(s)
  美馬秀樹
- Organizer
  第12回教育DXサロン
- Related Report
  2023 Research-status Report
- Invited
[Presentation] 学修成果の可視化と教育DX2023
- Author(s)
  美馬秀樹
- Organizer
  第15回教育DXサロン
- Related Report
  2023 Research-status Report
- Invited
[Presentation] AIの基礎と教育応用2023
- Author(s)
  美馬秀樹
- Organizer
  第100回e教育サロン勉強会
- Related Report
  2023 Research-status Report
- Invited
[Presentation] 自律的学習を育成する履修計画支援プログラムの開発と効果検証2023
- Author(s)
  五島譲司、中道雅樹、美馬秀樹、津田純子
- Organizer
  第29回大学教育研究フォーラム
- Related Report
  2022 Research-status Report
[Presentation] 音声言語理解を活用した授業の可視化2022
- Author(s)
  美馬秀樹
- Organizer
  可視化情報シンポジウム2022
- Related Report
  2022 Research-status Report
[Presentation] 人と共に進化するＡＩオンライン教育プラットフォームの開発2022
- Author(s)
  美馬秀樹
- Organizer
  京都大学　第１６回ＩＣＴイノベーション
- Related Report
  2021 Research-status Report
[Presentation] ＭＩＭＡサーチによるプロパティの可視化とマッチング支援2021
- Author(s)
  鈴木羽留香, 美馬秀樹
- Organizer
  第４９回　可視化情報シンポジウム
- Related Report
  2021 Research-status Report
[Presentation] 「デジタル化の課題とデジタル化資料の活用について―情報学の観点から―」2021
- Author(s)
  美馬秀樹
- Organizer
  国立国会図書館デジタルライブラリーカフェ２０２１
- Related Report
  2021 Research-status Report
- Invited
[Presentation] AI（人工知能）を教育改善に使ってみよう2021
- Author(s)
  美馬秀樹
- Organizer
  京都大学高等教育研究開発推進センターポストコロナの大学授業（第9回）
- Related Report
  2021 Research-status Report
- Invited
[Presentation] MIMAサーチによる文書情報の可視化2021
- Author(s)
  美馬秀樹
- Organizer
  京都大学学術情報メディアセンターセミナー「文書テキスト分析・可視化システムを用いた情報の利活用」
- Related Report
  2020 Research-status Report
- Invited
[Presentation] 『MIMAサーチ』による学術会議の可視化2020
- Author(s)
  美馬秀樹
- Organizer
  学術会議公開シンポジウム「科学的知見の創出に資する可視化 (5)：ICT ／ビッグデータ時代の文理融合研究を支援する可視化」
- Related Report
  2020 Research-status Report
- Invited
[Presentation] オンライン授業を取り巻く環境2020
- Author(s)
  美馬秀樹
- Organizer
  JEPA Webセミナー
- Related Report
  2020 Research-status Report
- Invited

Automatic Multilingual Subtitling of Lecture Videos Towards University Globalization

Principal Investigator

美馬 秀樹 九州大学, 未来人材育成機構, 特任教授 (30359658)

¥4,290,000 (Direct Cost: ¥3,300,000、Indirect Cost: ¥990,000)

Current Status of Research Progress

Reason

Report

Research Products

[Journal Article] 九州大学におけるカリキュラムマップ・システムの構築と学修成果の可視化2023

Author(s)

Journal Title

Related Report

[Journal Article] 自然言語処理と可視化を利用した履修選択支援システムの実用化2020

Author(s)

Journal Title

NAID

Related Report

[Journal Article] 自動分類の応用可能性――大学カリキュラムの可視化・比較へのNDCの活用実験2020

Author(s)

Journal Title

Related Report

[Presentation] AIと教育DX2023

Author(s)

Organizer

Related Report

[Presentation] 学修成果の可視化と教育DX2023

Author(s)

Organizer

Related Report

[Presentation] AIの基礎と教育応用2023

Author(s)

Organizer

Related Report

[Presentation] 自律的学習を育成する履修計画支援プログラムの開発と効果検証2023

Author(s)

Organizer

Related Report

[Presentation] 音声言語理解を活用した授業の可視化2022

Author(s)

Organizer

Related Report

[Presentation] 人と共に進化するＡＩオンライン教育プラットフォームの開発2022

Author(s)

Organizer

Related Report

[Presentation] ＭＩＭＡサーチによるプロパティの可視化とマッチング支援2021

Author(s)

Organizer

Related Report

[Presentation] 「デジタル化の課題とデジタル化資料の活用について―情報学の観点から―」2021

Author(s)

Organizer

Related Report

[Presentation] AI（人工知能）を教育改善に使ってみよう2021

Author(s)

Organizer

Related Report

[Presentation] MIMAサーチによる文書情報の可視化2021

Author(s)

Organizer

Related Report

[Presentation] 『MIMAサーチ』による学術会議の可視化2020

Author(s)

Organizer

Related Report

[Presentation] オンライン授業を取り巻く環境2020

Author(s)

Organizer

Related Report

美馬秀樹九州大学, 未来人材育成機構, 特任教授 (30359658)