研究課題/領域番号 |
21K17805
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分61030:知能情報学関連
|
研究機関 | 大阪大学 |
研究代表者 |
森田 尭 大阪大学, 産業科学研究所, 助教 (10837587)
|
研究期間 (年度) |
2021-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2024年度: 260千円 (直接経費: 200千円、間接経費: 60千円)
2023年度: 520千円 (直接経費: 400千円、間接経費: 120千円)
2022年度: 390千円 (直接経費: 300千円、間接経費: 90千円)
2021年度: 3,120千円 (直接経費: 2,400千円、間接経費: 720千円)
|
キーワード | 深層学習 / 音声認識 / 音声合成 / 教師なし学習 / 音声学習 / 言語学習 / 身体性 |
研究開始時の研究の概要 |
この研究では個人差やばらつきの多い音声データを聞いて母音や子音のような一貫した区分を認識する人工知能を、人間に近い方法で学習過程で実現することを目指します。特に「聞く」だけではなく「話す」動作に着目し、舌や唇を動かして音声を模倣学習することが人工知能の音声認識にどのような影響を与えるのかを調査します。また、人工知能内が使う発声器官を人間を模したものから他の動物を模したものに置き換えた際、音声認識にどのような影響が起こるのかについても調査し、人間の言語の進化に関する問いにも迫ります。
|
研究実績の概要 |
初年度、調音合成モデルを用いた教師なし音声認識学習の研究が難航した結果を踏まえ、2022年度は、全面人工ニューラルネットワーク実装による音声認識と音声合成の同時教師なし学習について、先行研究が抱える問題点の解決に焦点を置き、研究に取り組んだ。当初、教師あり音声合成を用いた研究を実施予定であったが、全面教師なし学習で同等の研究実施可能性の見込みが立ったため、計画を変更した。具体的には、教師なし学習で得られる離散的記号表現の、時間解像度および記号数の観点から見た簡略化に取り組み、特に時間解像度の圧縮については、先行研究の5分の2にまで圧縮できる見込みが立った。 一方で、本研究課題用に昨年度購入した計算サーバに不具合が発生し、各種計算の実施に遅延した。不具合についての原因究明を、納品元と協力して進めているが、まだ解決しておらず、既に終了した別研究課題の計算資源を代替手段として利用し、研究を実施している状況である。 発信面では、招待講演で本研究が取り組む教師なし音声認識を周知した他、教師なし音声認識技術を活用した動物音声研究を査読付き国際会議にて発表した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
本研究課題実施用に昨年度購入した計算サーバに不具合が発生し、関連する計算が大きく遅延した。2022年秋で終了した別研究課題の計算資源を代替手段として、本研究課題の実施に当てたものの、予定していた規模の探求を実施することができなかった。
|
今後の研究の推進方策 |
2022年度に引き続き、教師なし音声認識・音声合成における離散表現の大幅簡略化の実現を当面の目標とする。 不具合が発生しているサーバについては納品元と協力して早期復旧を目指し、さらに追加計算資源として、スーパーコンピュータシステムの活用も検討する。
|