研究課題/領域番号 |
20K03120
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分09070:教育工学関連
|
研究機関 | 九州大学 (2022-2023) 京都大学 (2021) 東京大学 (2020) |
研究代表者 |
美馬 秀樹 九州大学, 未来人材育成機構, 特任教授 (30359658)
|
研究分担者 |
増田 勝也 東京大学, 大学総合教育研究センター, 特任助教 (20512114)
小松 祐美 東京大学, 大学総合教育研究センター, 学術専門職員 (50792511)
|
研究期間 (年度) |
2020-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2022年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2021年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
2020年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
|
キーワード | 自動字幕付与 / 音声認識 / 機械翻訳 / 音声翻訳 / オンライン講義 / 教育DX / 科目ナンバリング / 可視化 / トピック推定 / 文書分類 / 対訳コーパス / 講義ビデオコーパス / 書き起こし / アノテーション / 多言語字幕付与 / カット自動編集 / トピック分割 / 多言語字幕付与システム / 精度向上 / 実現可能性 / 多言語音声翻訳 / 字幕付与 / 講義ビデオ |
研究開始時の研究の概要 |
教育のグローバル化という観点から時間・場所・個人を問わず“いつでも、どこでも、だれにでも”同等の教育の機会を提供することは非常に重要である。これには単純に普段の講義映像を撮影して公開するのではなく、映像に対して文字情報の付与や適切な編集、内容の提示など、付加的情報を併せて公開することが重要である。本研究では、まず講義映像を対象とした音声認識・自動翻訳システムの研究開発を行い高精度な多言語字幕を作成可能なシステムを開発する。また音声認識結果を利用したトピックの抽出を行いトピックによる映像のチャプター分割や検索を可能とすることで、近年、注目されているマイクロコンテンツと同様のアクセス性を持たせる。
|
研究実績の概要 |
“いつでも,どこでも,だれにでも”同等の教育の機会を提供することは非常に重要である.国連サミットにて採択されたSDGsにおいても,「質の高い教育をみんなに」は,今後の持続可能な社会における重要な政策目標の一つとなっている.また,海外からの留学性や教員も利用することを考慮すると,字幕に対して翻訳を行うことも必要な要素である.講義映像が短時間で少量であれば人手で行うことも可能であるが,一般に高コストである。そこで映像音声に対して自動的に音声認識を行い,その結果を字幕として付与する研究開発が行われている.しかしながら,音声認識の精度は年々向上してはいるものの,そのまま字幕として使用するには未だ十分な精度とは言い難い.特に,本研究で対象とする高等教育での講義映像の音声には専門用語が多く含まれており,認識できない用語があるのに加え,字幕として利用するためには同音異義語も正しく漢字へと変換することが必要となるが、これには講義で話されているテキストを大量に収集し、言語モデルを再構成することが望ましい。令和5年度には、引き続きサイバー大学より講義ビデオのご提供をいただき、収集した約100時間分の講義ビデオに対し、情報通信研究機構(NICT)との共同により音声テキストデータの抽出を進めた。音声翻訳の精度向上のためのデータとして利用し、実際の講義ビデオに適用することで、リアルタイムの字幕付与に関して、実用に耐えうる品質となることを確認した。 一方で、講義に係るテキストを対象に、自然言語処理、及び機械学習による分析を行うことで、講義へのトピックの自動付与、講義の自動分類等が行えるプログラムを開発し、精度の検証を行っているところである。本プログラムにより、研究課題である、多言語に対する言語処理のみならず、科目ナンバリングの自動付与や、カリキュラムの自動構成のような高度なタスクへの応用も期待される。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
COVID-19の影響により、十分な時間が確保できず、当初、計画をしていた予定より若干、研究の進行が遅れる結果となった。 なお、本理由により、研究期間の再延長を申請し、受理されている状態である。
|
今後の研究の推進方策 |
今後は、これまでに作成した講義音声コーパスを利用し、音声モデル、言語モデルの再学習を行うことで、音声認識の精度を向上するとともに、音声字幕を付与した講義ビデオ再生が行えるシステムの開発や、機械翻訳を統合した自動翻訳字幕付与のシステムの構築と実験評価を行うことを目指す。 併せて、開発した言語処理プログラムを様々な教育関連テキストに適用することで、より高度な教育支援環境の実現を目指す。
|