研究課題/領域番号 |
19K24343
|
研究種目 |
研究活動スタート支援
|
配分区分 | 基金 |
審査区分 |
1001:情報科学、情報工学およびその関連分野
|
研究機関 | 神戸大学 |
研究代表者 |
高島 遼一 神戸大学, 都市安全研究センター, 准教授 (50846102)
|
研究期間 (年度) |
2019-08-30 – 2021-03-31
|
研究課題ステータス |
完了 (2020年度)
|
配分額 *注記 |
2,860千円 (直接経費: 2,200千円、間接経費: 660千円)
2020年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2019年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
|
キーワード | 音声認識 / 音声対話 / ニューラルネットワーク / 機械学習 |
研究開始時の研究の概要 |
近年の労働力不足の問題解決のため、サービスロボットに対するニーズが高まっている。本研究では、サービスロボットとの円滑なインタラクションを目的とした、音声対話の研究を行う。実用シーンでは雑音の大きい音声が入力されやすく、音声認識が誤りやすい状況下で適切な応答を出力する必要がある。従来では、この問題に対して雑音除去、音声認識、対話技術が個別に研究されており、必ずしも対話成功という目的に対して全体最適化がされていない。本研究では、音声入力から対話までの全モジュールを、対話成功の目的から全体最適化することで性能向上を目指すとともに、人間の聴覚から対話までの仕組みを機械学習の観点で理解することを目指す。
|
研究成果の概要 |
本研究では、音声対話の分野において従来独立に最適化されていた音声認識や対話のモジュールを一体化し、音声対話成功という損失関数の元で学習するEnd-to-Endモデルの構築を最終目的としている。しかし一般にこのモデルの学習には膨大な学習データが必要であるため、限られたデータ量でモデルを学習するための手法の開発が必要である。そこで本研究では、音声認識と対話のモデルに対して限られたデータ量であっても安定した学習を行うための手法として、多段階の転移学習や自己教師あり学習、外部知識の利用といった手法を提案し、音声認識、対話タスクにおいて従来法よりも性能の高いモデルを学習可能であることを確認した。
|
研究成果の学術的意義や社会的意義 |
近年の労働力不足の問題解決のため、サービスロボットに対するニーズが高まっている。音声によるロボットとの対話はユーザにとって馴染みやすいが、高雑音環境といった音声認識が困難な状況では期待した対話性能が得られない。従来、このような問題に対して音声認識、対話技術が個別に最適化される形で研究されており、必ずしも音声対話成功という最終目的に対して最適化がされていなかった。これらのモジュールを一本化して全体最適化が行えればさらに性能向上が見込まれるが、これには膨大な学習データが必要である。本研究の成果は、限られた学習データで安定してモデルを学習する方式であり、前述の全体最適化に利用可能と期待している。
|