2020 Fiscal Year Annual Research Report
Video Archiving of Dialect Speech and Establishment of Information Processing Technology for Understanding Dialect Speech
Project/Area Number |
18K11358
|
Research Institution | Iwate Prefectural University |
Principal Investigator |
伊藤 慶明 岩手県立大学, ソフトウェア情報学部, 教授 (90325928)
|
Co-Investigator(Kenkyū-buntansha) |
李 時旭 国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (50415642)
松原 雅文 岩手県立大学, ソフトウェア情報学部, 准教授 (70363728)
|
Project Period (FY) |
2018-04-01 – 2021-03-31
|
Keywords | 方言音声処理 / 音声中の検索語検出 / 音声認識 / 深層学習 |
Outline of Annual Research Achievements |
本研究課題は、遠野地域の語り部の会からの要望もあり、語り部の遠野昔話の語りの収録を行うことで、遠野方言・民話保存活動に関する地域貢献を果たすこと、および標準語とは言語・音素・イントネーション体系が異なる方言音声に対して検索技術を確立すること、さらに、一般の人が遠野方言の民話を聞いても理解できるように語りの理解をサポートする技術を検討すること、これらを研究の目的としている。この目的のもと、本年度までに以下の研究開発を推進した。 ① 方言音声のデータベース化:遠野文化研究センターおよび遠野昔話語り部の会と協力して、遠野地方の語り部が話す民話のビデオ収録を完了し、13人約14時間の方言音声を含むビデオデータが構築できた。遠野方言・民話保存活動を進めている遠野地域へ無料で提供し地域貢献を果たすことができた。現在、方言音声の研究利用方法についての検討を進めている ② 方言音声の検索システムの研究開発:一般に方言には辞書がなく、方言音声にテキストが付与されたデータがなく、標準語の音声認識システムを利用できない。標準語の単語体系・音素体系と異なる方言音声に対して、我々の開発した語彙に依存しない音声検索システムの適用を行った。これまでに、検索精度を向上させるため、最新のLong short term memory(LSTM)や双方向LSTM,End-to-endモデル等の深層学習モデルの利用を図った。また、方言音声の検索に、英語などの多言語を用いることにより検索精度の向上を図った。さらに、高精度・高速・低メモリでの検索方式を研究開発した。これらの検索技術を応用し、語り部が話している民話中のキーワードに対しリアルタイムに検索・検出を可能にするシステムの検討を行った。出力ノード数を少数に限定した深層学習モデルを複数利用することで、高精度・高速・低メモリでの検索が実現できることを確認できた。
|