2022 Fiscal Year Research-status Report
発声運動学習が音声認識学習に与える影響に関する計算言語学的研究
Project/Area Number |
21K17805
|
Research Institution | Osaka University |
Principal Investigator |
森田 尭 大阪大学, 産業科学研究所, 助教 (10837587)
|
Project Period (FY) |
2021-04-01 – 2025-03-31
|
Keywords | 深層学習 / 音声認識 / 音声合成 / 教師なし学習 |
Outline of Annual Research Achievements |
初年度、調音合成モデルを用いた教師なし音声認識学習の研究が難航した結果を踏まえ、2022年度は、全面人工ニューラルネットワーク実装による音声認識と音声合成の同時教師なし学習について、先行研究が抱える問題点の解決に焦点を置き、研究に取り組んだ。当初、教師あり音声合成を用いた研究を実施予定であったが、全面教師なし学習で同等の研究実施可能性の見込みが立ったため、計画を変更した。具体的には、教師なし学習で得られる離散的記号表現の、時間解像度および記号数の観点から見た簡略化に取り組み、特に時間解像度の圧縮については、先行研究の5分の2にまで圧縮できる見込みが立った。 一方で、本研究課題用に昨年度購入した計算サーバに不具合が発生し、各種計算の実施に遅延した。不具合についての原因究明を、納品元と協力して進めているが、まだ解決しておらず、既に終了した別研究課題の計算資源を代替手段として利用し、研究を実施している状況である。 発信面では、招待講演で本研究が取り組む教師なし音声認識を周知した他、教師なし音声認識技術を活用した動物音声研究を査読付き国際会議にて発表した。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
本研究課題実施用に昨年度購入した計算サーバに不具合が発生し、関連する計算が大きく遅延した。2022年秋で終了した別研究課題の計算資源を代替手段として、本研究課題の実施に当てたものの、予定していた規模の探求を実施することができなかった。
|
Strategy for Future Research Activity |
2022年度に引き続き、教師なし音声認識・音声合成における離散表現の大幅簡略化の実現を当面の目標とする。 不具合が発生しているサーバについては納品元と協力して早期復旧を目指し、さらに追加計算資源として、スーパーコンピュータシステムの活用も検討する。
|
Causes of Carryover |
研究計画の遅れのため、当初予定していた国際会議や雑誌での成果発表ができなかった。次年度使用額は、研究遅延を解決するための追加計算資源確保に使用予定である。
|
Research Products
(5 results)