研究課題/領域番号 |
21K17805
|
研究機関 | 大阪大学 |
研究代表者 |
森田 尭 大阪大学, 産業科学研究所, 助教 (10837587)
|
研究期間 (年度) |
2021-04-01 – 2025-03-31
|
キーワード | 深層学習 / 音声認識 / 音声合成 / 教師なし学習 |
研究実績の概要 |
初年度、調音合成モデルを用いた教師なし音声認識学習の研究が難航した結果を踏まえ、2022年度は、全面人工ニューラルネットワーク実装による音声認識と音声合成の同時教師なし学習について、先行研究が抱える問題点の解決に焦点を置き、研究に取り組んだ。当初、教師あり音声合成を用いた研究を実施予定であったが、全面教師なし学習で同等の研究実施可能性の見込みが立ったため、計画を変更した。具体的には、教師なし学習で得られる離散的記号表現の、時間解像度および記号数の観点から見た簡略化に取り組み、特に時間解像度の圧縮については、先行研究の5分の2にまで圧縮できる見込みが立った。 一方で、本研究課題用に昨年度購入した計算サーバに不具合が発生し、各種計算の実施に遅延した。不具合についての原因究明を、納品元と協力して進めているが、まだ解決しておらず、既に終了した別研究課題の計算資源を代替手段として利用し、研究を実施している状況である。 発信面では、招待講演で本研究が取り組む教師なし音声認識を周知した他、教師なし音声認識技術を活用した動物音声研究を査読付き国際会議にて発表した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
本研究課題実施用に昨年度購入した計算サーバに不具合が発生し、関連する計算が大きく遅延した。2022年秋で終了した別研究課題の計算資源を代替手段として、本研究課題の実施に当てたものの、予定していた規模の探求を実施することができなかった。
|
今後の研究の推進方策 |
2022年度に引き続き、教師なし音声認識・音声合成における離散表現の大幅簡略化の実現を当面の目標とする。 不具合が発生しているサーバについては納品元と協力して早期復旧を目指し、さらに追加計算資源として、スーパーコンピュータシステムの活用も検討する。
|
次年度使用額が生じた理由 |
研究計画の遅れのため、当初予定していた国際会議や雑誌での成果発表ができなかった。次年度使用額は、研究遅延を解決するための追加計算資源確保に使用予定である。
|