研究課題/領域番号 |
17H01763
|
研究機関 | 名古屋大学 |
研究代表者 |
戸田 智基 名古屋大学, 情報基盤センター, 教授 (90403328)
|
研究分担者 |
亀岡 弘和 日本電信電話株式会社NTTコミュニケーション科学基礎研究所, メディア情報研究部, 主任研究員 (20466402)
北岡 教英 徳島大学, 大学院社会産業理工学研究部(理工学域), 教授 (10333501)
|
研究期間 (年度) |
2017-04-01 – 2020-03-31
|
キーワード | 音声等認識 |
研究実績の概要 |
強調グループ、認識グループ、収録グループといった3つの研究グループを構成し、それぞれのグループにおいて以下の研究課題に取り組んだ。 強調グループの研究実績:空気伝導音信号と体内伝導音信号を相補的に活用した音声強調技術ならびに音源強調技術の研究に取り組んだ。音声強調技術としては、音声生成過程の仕組みを考慮した統計的音声特徴量モデリング技術の構築に加え、畳み込みニューラルネットワークや敵対的生成ネットワークなどの深層学習手法を用いた音声波形モデリング技術や音声変換技術の構築も行った。音源強調技術としては、各音源信号の音色に関する統計的性質を事前情報として活用した音源分離、歌声分離、音声強調技術を構築した。これらの研究成果について、学術論文誌、国際会議、国内会議にて発表を行った。また、2件の招待講演を実施するとともに、1件の学生奨励賞を受賞した。 認識グループの研究実績:空気伝導音信号と体内伝導音信号を相補的に活用した音声認識技術ならびに環境音認識技術の研究に取り組んだ。音声認識技術としては、深層学習に基づく非可聴つぶやき認識技術を構築するとともに、発話者ならびに音環境情報への適応技術を構築した。環境音認識技術としては、様々な音イベントに対して共有可能な記号表現の獲得を目指し、深層学習に基づく音波形信号から擬音語表現への変換技術を構築した。これらの研究成果について、国内会議にて発表を行い、1件の学生優秀発表賞を受賞した。 収録グループの研究実績:空気伝導音信号と体内伝導音信号を相補的に活用した音声/音環境情報処理基盤の研究に用いるデータ収録に向けて、既存の空気伝導マイクロフォンおよび体内伝導マイクロフォンを使用して、ウェアラブル型の多チャネル空気・体内伝導音収録装置の試作に着手した。また、空気・体内伝導音収録の予備的検討を進めた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
強調グループに関しては、多様な基盤技術を構築し、実験的評価によりその有効性を示すことができた。特に、音声強調技術に関する研究において、当初の計画を大きく上回る進展が得られた。また、音源強調技術に関する研究においても、当初の計画を上回る進展が得られた。 認識グループに関しては、概ね当初の計画通りの進展が得られた。 収録グループに関しては、プロトタイプ収録機器の試作ならびに収録作業の実施に着手することができたものの、本格的な収録作業を開始するためには、さらなる時間を要することが分かった。 総合的に考えると、おおむね順調に進展していると考える。
|
今後の研究の推進方策 |
前年度に引き続き、強調グループ、認識グループ、収録グループといった3つの研究グループを構成し、それぞれのグループにおいて以下の研究課題に取り組む。 強調グループの計画:前年度に引き続き、空気伝導音信号と体内伝導音信号を相補的に活用した音声強調技術、ならびに、音源強調技術の研究に取り組む。前年度と同様に、幅広い基盤技術の構築を目指す。 認識グループの計画:前年度に引き続き、空気伝導音信号と体内伝導音信号を相補的に活用した音声認識技術ならびに環境音認識技術の研究に取り組む。前年度構築した基盤技術を発展させるとともに、空気・体内伝導音信号を活用した自己発声音制御技術の構築にも着手する。 収録グループの計画:前年度の検討結果を下に、ウェアラブル型の多チャネル空気/体内伝導マイクロフォンによる収録システムの構築および改善に取り組み、構築したシステムを用いた空気/体内伝導音信号収録に着手する。
|