2014 Fiscal Year Research-status Report
時間周波数平面上の成分移動による高耐性音声の研究と研究者用音声データベースの作成
Project/Area Number |
26330188
|
Research Institution | The University of Electro-Communications |
Principal Investigator |
高橋 弘太 電気通信大学, 情報理工学(系)研究科, 准教授 (10188005)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | 音声音響データベース / 話速変換 |
Outline of Annual Research Achievements |
本研究の第一の目的である「騒音に対する耐性の高い拡声システム」の試作に関しては,本年度は以下の成果を得た.システムのハードウエア的な準備に関しては,FPGAシステムの拡充を行った.本年度よりCPUを内蔵したFPGAを取り入れ,時間周波数平面上での各点について一様に行う計算量が大きく単純な処理は論理素子とDSPブロックで行う方針は変わらないが,入力信号に対する適応化など,より上位の処理については,ソフトウエアで実現できるような枠組みを整えた.また,システムの実装に関する準備に関しては,本研究で中心的となっている現行アルゴリズムをFPGAシステム上への実装を試みた.FPGA上では固定小数点演算に限定されるので,各計算の結果を何ビットに制限するかというところに詳細な検討を必要とすることがわかった.システムでの処理アルゴリズムの検討に関しては,本年度は時間軸方向での成分移動に的を絞って研究を行った.その結果,聞かせたい音の時間軸移動の有効性について目処をつけ,どの程度の時間軸移動を行えばよいのかの検討にとりかかることができた.また,音声のフォルマント情報をもとに,特定のフォルマントを優先させて拡声する方法についても実験を行なってその有効性を検証した.本研究の第二の目的である「音声音響データベースの構築」に関しては,前年度までの一連の研究で得られた音声について,編集と整理を行うとともに,音響信号として音楽も加え,研究用音源として利用できるように編集を行った.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
第一の目的である「騒音に対する耐性の高い拡声システム」の試作に関しては,研究はほぼ順調に進行している.システム試作には,ハードウエアの構築と,論理合成などの実装技術やノウハウの修得,そして,搭載するアルゴリズムに関する検討が必要となる.ハードウエアの構築に関しては,軽量で柔軟性に富むデバイスを採用する方向と,最先端のデバイスを採用する方向の両面で研究を進めており,今後のどのような展開にも対応できる体制にある.実装技術やノウハウの修得についても,新しいデバイスを使いこなし,たFPGAの開発ツールが一新されたが,それにも追従して使いこなすことができている.搭載するアルゴリズムに関する検討については,間軸移動の方法について検討し,またフォルマントの検出と利用の技術についても,ソフトエア的な研究ツールを構築して,今後の研究をより効率良く行える準備が整った.第二の目的である「音声音響データベースの構築」に関しても,本年度は音声の収録こそ行わなかったものの,既存の音声の編集や利用方法の検討を進め,また,研究に利用できる音楽のデータを追加するなどしており,進展していると自己評価している.以上より,研究初年度として十分な研究成果が達成がされたと自己評価している.
|
Strategy for Future Research Activity |
研究は予定どおりに進行しており,大きな予定変更や,解決しなければならない新たな問題が生じたということはない.したがって,次年度以降も当初の計画どおりに着々と研究を進めて行く予定である.システムの試作としては,大規模で高性能なシステムに活路を見出す方法と,応用も見据えて,省電力で安価な小規模システムに活路を見出す方法の両面が現時点では考えられているが,次年度においては,片方に絞ること無く両面を比較検討しながら,研究を進めたい.搭載するアルゴリズムに関しては,時間軸方向での成分移動はすでに取り掛かっているが,周波数軸方向の成分移動は,試行的に1つのプログラムを作成して予備実験を行ったに留まっているので,次年度以降は多数の方法をあげて比較検討する方法で研究を進めたい.「音声音響データベースの構築」に関しては,次年度以降,音声の音源数を増やすことにも尽力し,本研究プロジェクトが終了したときには,より多くの研究者に利用してもらえるように広報活動にも精を入れたいと考えている.
|
Causes of Carryover |
音声の録音に関して,プロフェッショナルの発話者(放送局のアナウンサー経験のある方など)を,本年度は呼ぶ必要はなかったため残金が生じた.また,国際会議発表(ICASSP-2015,オーストラリア)の旅費に関しては,アクセプトされたのが本年度1月ではあったが,会議開催は4月であったため,本年度の使用とはならなかった.なお,プロフェッショナルの発話者を呼んでの収録を行わなかった理由としては,すでに収録した音声の編集に力を入れたほうが良いと考えたことと,予定外の音楽素材の収録に取り組んだことがあげられる.
|
Expenditure Plan for Carryover Budget |
プロフェッショナルの発話者を呼んでの収録や,学会発表は,いずれも来年度以降必要となるものであるので,次年度使用として繰り越すこととなった.また,次年度は,当初の計画どおり研究を行うので,次年度分として当初予定されていた額にこれらの経費を加算して使用することとなった.
|
Research Products
(5 results)