• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2014 年度 実施状況報告書

時間周波数平面上の成分移動による高耐性音声の研究と研究者用音声データベースの作成

研究課題

研究課題/領域番号 26330188
研究機関電気通信大学

研究代表者

高橋 弘太  電気通信大学, 情報理工学(系)研究科, 准教授 (10188005)

研究期間 (年度) 2014-04-01 – 2017-03-31
キーワード音声音響データベース / 話速変換
研究実績の概要

本研究の第一の目的である「騒音に対する耐性の高い拡声システム」の試作に関しては,本年度は以下の成果を得た.システムのハードウエア的な準備に関しては,FPGAシステムの拡充を行った.本年度よりCPUを内蔵したFPGAを取り入れ,時間周波数平面上での各点について一様に行う計算量が大きく単純な処理は論理素子とDSPブロックで行う方針は変わらないが,入力信号に対する適応化など,より上位の処理については,ソフトウエアで実現できるような枠組みを整えた.また,システムの実装に関する準備に関しては,本研究で中心的となっている現行アルゴリズムをFPGAシステム上への実装を試みた.FPGA上では固定小数点演算に限定されるので,各計算の結果を何ビットに制限するかというところに詳細な検討を必要とすることがわかった.システムでの処理アルゴリズムの検討に関しては,本年度は時間軸方向での成分移動に的を絞って研究を行った.その結果,聞かせたい音の時間軸移動の有効性について目処をつけ,どの程度の時間軸移動を行えばよいのかの検討にとりかかることができた.また,音声のフォルマント情報をもとに,特定のフォルマントを優先させて拡声する方法についても実験を行なってその有効性を検証した.本研究の第二の目的である「音声音響データベースの構築」に関しては,前年度までの一連の研究で得られた音声について,編集と整理を行うとともに,音響信号として音楽も加え,研究用音源として利用できるように編集を行った.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

第一の目的である「騒音に対する耐性の高い拡声システム」の試作に関しては,研究はほぼ順調に進行している.システム試作には,ハードウエアの構築と,論理合成などの実装技術やノウハウの修得,そして,搭載するアルゴリズムに関する検討が必要となる.ハードウエアの構築に関しては,軽量で柔軟性に富むデバイスを採用する方向と,最先端のデバイスを採用する方向の両面で研究を進めており,今後のどのような展開にも対応できる体制にある.実装技術やノウハウの修得についても,新しいデバイスを使いこなし,たFPGAの開発ツールが一新されたが,それにも追従して使いこなすことができている.搭載するアルゴリズムに関する検討については,間軸移動の方法について検討し,またフォルマントの検出と利用の技術についても,ソフトエア的な研究ツールを構築して,今後の研究をより効率良く行える準備が整った.第二の目的である「音声音響データベースの構築」に関しても,本年度は音声の収録こそ行わなかったものの,既存の音声の編集や利用方法の検討を進め,また,研究に利用できる音楽のデータを追加するなどしており,進展していると自己評価している.以上より,研究初年度として十分な研究成果が達成がされたと自己評価している.

今後の研究の推進方策

研究は予定どおりに進行しており,大きな予定変更や,解決しなければならない新たな問題が生じたということはない.したがって,次年度以降も当初の計画どおりに着々と研究を進めて行く予定である.システムの試作としては,大規模で高性能なシステムに活路を見出す方法と,応用も見据えて,省電力で安価な小規模システムに活路を見出す方法の両面が現時点では考えられているが,次年度においては,片方に絞ること無く両面を比較検討しながら,研究を進めたい.搭載するアルゴリズムに関しては,時間軸方向での成分移動はすでに取り掛かっているが,周波数軸方向の成分移動は,試行的に1つのプログラムを作成して予備実験を行ったに留まっているので,次年度以降は多数の方法をあげて比較検討する方法で研究を進めたい.「音声音響データベースの構築」に関しては,次年度以降,音声の音源数を増やすことにも尽力し,本研究プロジェクトが終了したときには,より多くの研究者に利用してもらえるように広報活動にも精を入れたいと考えている.

次年度使用額が生じた理由

音声の録音に関して,プロフェッショナルの発話者(放送局のアナウンサー経験のある方など)を,本年度は呼ぶ必要はなかったため残金が生じた.また,国際会議発表(ICASSP-2015,オーストラリア)の旅費に関しては,アクセプトされたのが本年度1月ではあったが,会議開催は4月であったため,本年度の使用とはならなかった.なお,プロフェッショナルの発話者を呼んでの収録を行わなかった理由としては,すでに収録した音声の編集に力を入れたほうが良いと考えたことと,予定外の音楽素材の収録に取り組んだことがあげられる.

次年度使用額の使用計画

プロフェッショナルの発話者を呼んでの収録や,学会発表は,いずれも来年度以降必要となるものであるので,次年度使用として繰り越すこととなった.また,次年度は,当初の計画どおり研究を行うので,次年度分として当初予定されていた額にこれらの経費を加算して使用することとなった.

  • 研究成果

    (5件)

すべて 2015 2014 その他

すべて 学会発表 (3件) 備考 (1件) 産業財産権 (1件)

  • [学会発表] NOVEL SOUND MIXING METHOD FOR VOICE AND BACKGROUND MUSIC2015

    • 著者名/発表者名
      Wataru Owaki, Kota Takahashi
    • 学会等名
      IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2015)
    • 発表場所
      Brisbane Convention & Exhibition Centre South Brisbane, Queensland, Australia
    • 年月日
      2015-04-19 – 2015-04-24
  • [学会発表] フォルマント構造維持を規範とした音声信号混合法2014

    • 著者名/発表者名
      旭岡舜介・大脇 渉・高橋弘太
    • 学会等名
      電子情報通信学会応用音響研究会
    • 発表場所
      日立製作所中央研究所講堂
    • 年月日
      2014-10-24
  • [学会発表] 画像を媒介とした直観的操作が可能なスマートミキサー2014

    • 著者名/発表者名
      田本祐樹・大脇 渉・高橋弘太
    • 学会等名
      電子情報通信学会応用音響研究会
    • 発表場所
      日立製作所中央研究所講堂
    • 年月日
      2014-10-24
  • [備考] 話速バリエーション型音声データベース(SRV-DB)

    • URL

      http://www.it.ice.uec.ac.jp/SRV-DB/

  • [産業財産権] ミキシング装置、信号ミキシング方法、及びミキシングプログラム2015

    • 発明者名
      高橋弘太
    • 権利者名
      国立大学法人電気通信大学
    • 産業財産権種類
      特許特願2015-007380
    • 産業財産権番号
      特願2015-007380
    • 出願年月日
      2015-01-19

URL: 

公開日: 2016-05-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi