• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2011 Fiscal Year Research-status Report

フレキシブルな時間軸による音声再生システムの研究と研究者用音声データベースの作成

Research Project

Project/Area Number 23500147
Research InstitutionThe University of Electro-Communications

Principal Investigator

高橋 弘太  電気通信大学, 情報理工学(系)研究科, 准教授 (10188005)

Project Period (FY) 2011-04-28 – 2014-03-31
Keywordsユーザモデル / 話速変換
Research Abstract

本研究の目的は,平成22年度までの3年間にわたって科研費の助成を受けて行った「フレキシブルな時間軸による再生機」の研究を進め,それを実用となるレベルで実装することであり,同時に,フレキシブルな時間軸による再生機の研究の中の要素技術である話速推定の技術や,話速変換のための信号処理技術を体系的に研究するための音声データベースの構築を,本研究の中で行うことである.そして,構築した音声データベースをWebページを用いて公開し,広く全国の研究者の研究に役立ててもらい,話速推定や話速が人間に及ぼす影響などの研究が,本研究テーマの担当研究者だけでなく,より多くの研究者によって研究されることを促進し,この分野を,音声信号処理の研究の中の一分野として確立することである. 本年度は,「フレキシブルな時間軸による再生機」の研究においては,実装対象となるFPGA基板を,前年度に比較してより高性能なデバイスVertex-6を用いたものに置き換えた.前年度まで用いていたSpartan-6を用いた設計に比べて,どのような差があるのかを具体的に調べ,Vertex-6での設計のスキルを高めることができた. また.本年度は,音声データベース構築に際し,新たに録音した2名の音声による62文章を4段階の話速で録音したものについて,編集,リップノイズ除去,音量調整などの膨大な作業を行って,2011年11月に新たに240ファイルを公開することができた.昨年度まで作り上げてきた1658ファイルに,本年度の成果を加えると1898ファイルになる.話速を厳密に管理して,複数の話者が,多彩な文章を読み上げるという形式のこれだけ大規模な音声データベースは国内外ともに例がなく,すでに,この分野の研究をすすめる研究者の役にたてるものが出来上がりつつあると考えている.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

「フレキシブルな時間軸による再生機」の研究においては,予定どおりVertex-6を導入することができたこと,Spartax-6に比べて高集積である上,内部のセルや演算部の能力も上であるため,大幅な演算能力向上が期待されていたが,予想どおりの性能が得られることが確認できたこと,そして,予想できなかったような問題点もないことが確認できたこと,などから,おおむね順調に進展していると自己評価した. また,「話速バリエーション型音声データベース」の構築に関しては,録音やその後の編集などで震災の影響を受けて思い通りに進まない面もあったが,夏ごろに集中的に時間をとって手作業による編集をすすめ,この作業に大学院生が全面的に協力してくれたこともあって,予定どおり,集録データを増加させることができた.以上のことより,「音声データベース」の構築に関しても,おおむね順調に進展していると自己評価している. 以上,両者をあわせて,全体としても,おおむね順調と考えている.

Strategy for Future Research Activity

当初の計画どおり研究をすすめることを考えている.すなわち,「フレキシブルな時間軸による再生機」の実装の研究と,話速バリエーション型音声データベース」の研究を車輪の両輪ととらえて,話速推定,話速変換,聞き取りやすい音声とはなにか,といったサブ研究テーマにとりくみつつ,最終的な先端的再生機について具体化していく. 同時に,FPGAなどハードウエア技術に関するスキルを高め,組み込み型液晶ディスプレイによる状態表示など,インタラクティブな機能も持たせていきたいと考えている. 「話速バリエーション型音声データベース」については,本研究テーマを終了後も,多くの研究者に利用してもらえるものとしたいので,データベースとして,さらに使いやすいように整理し,ラベルなどメタ情報も一部のデータには付け加えるなどして,ひとりでも多くの研究者に利用してもらいたいと考えている.

Expenditure Plans for the Next FY Research Funding

「フレキシブルな時間軸による再生機」の研究においては,FPA開発ツールのライセンス料が発生する.また,組み込み型液晶ディスプレイによるインタラクティブな操作盤を作成するためにも部品代が発生する.開発ツールを走らせるための計算機であるが,より上位のVertex-6に変更したところ,配置配線に膨大な時間がかかるようになってしまったので,より高速な計算機を導入することを計画している. 「話速バリエーション型音声データベース」の構築に関しては,発声することを職業としているプロフェッショナルなアナウンサー,ナレーターを話者として迎えるために,出演料が必要となる.集音環境を整えるために,防音材などを本年度は補強したい.また,データベースを公開しているサーバーマシンも,すでに数年が経過したのでリプレイスが必要である.その他,研究成果を発表するための論文投稿料も必要となる. 以上のように研究費を使用させて頂くことを計画している.

  • Research Products

    (6 results)

All 2011 Other

All Journal Article (1 results) (of which Peer Reviewed: 1 results) Presentation (4 results) Remarks (1 results)

  • [Journal Article] ディジタルオーディオ信号のサンプル欠けの位置推定と修復2011

    • Author(s)
      高橋弘太
    • Journal Title

      電子情報通信学会論文誌

      Volume: J94-D/7 Pages: 1088-1100

    • Peer Reviewed
  • [Presentation] 先度付き非線形演算による新しいサウンドミキサー ~ スマートミキサーの提案 ~

    • Author(s)
      高橋弘太,有北知弘,大脇渉,手塚歩,宮地紘司
    • Organizer
      日本音響学会春季研究発表会
    • Place of Presentation
      神奈川大学
    • Year and Date
      2012年3月15日
  • [Presentation] 音声を埋もれさせない音信号混合法 ~ スマートミキサーの提案 ~

    • Author(s)
      大脇渉,有北知弘,手塚歩,宮地紘司,高橋弘太
    • Organizer
      日本音響学会春季研究発表会
    • Place of Presentation
      神奈川大学
    • Year and Date
      2012年3月13日
  • [Presentation] スマートミキサー ~ 基本原理と有効性 ~

    • Author(s)
      高橋弘太, 大脇渉
    • Organizer
      電子情報通信学会応用音響研究会
    • Place of Presentation
      機械振興会館
    • Year and Date
      2011年12月9日
  • [Presentation] スマートミキサー ~ 新しい音信号混合法 ~

    • Author(s)
      大脇渉,高橋弘太
    • Organizer
      電子情報通信学会応用音響研究会
    • Place of Presentation
      機械振興会館
    • Year and Date
      2011年12月9日
  • [Remarks] 話速バリエーション型音声データベースの公開データのページは以下のとおりです.

    • URL

      http://www.it.ice.uec.ac.jp/SRV-DB/

URL: 

Published: 2013-07-10  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi