研究課題/領域番号 |
23500147
|
研究機関 | 電気通信大学 |
研究代表者 |
高橋 弘太 電気通信大学, 情報理工学(系)研究科, 准教授 (10188005)
|
研究期間 (年度) |
2011-04-28 – 2014-03-31
|
キーワード | ユーザモデル / 話速変換 |
研究概要 |
本研究の目的は,平成22年度までの3年間にわたって科研費の助成を受けて行った「フレキシブルな時間軸による再生機」の研究を進め,それを実用となるレベルで実装することであり,同時に,フレキシブルな時間軸による再生機の研究の中の要素技術である話速推定の技術や,話速変換のための信号処理技術を体系的に研究するための音声データベースの構築を,本研究の中で行うことである.そして,構築した音声データベースをWebページを用いて公開し,広く全国の研究者の研究に役立ててもらい,話速推定や話速が人間に及ぼす影響などの研究が,本研究テーマの担当研究者だけでなく,より多くの研究者によって研究されることを促進し,この分野を,音声信号処理の研究の中の一分野として確立することである. 本年度は,「フレキシブルな時間軸による再生機」の研究においては,実装対象となるFPGA基板を,前年度に比較してより高性能なデバイスVertex-6を用いたものに置き換えた.前年度まで用いていたSpartan-6を用いた設計に比べて,どのような差があるのかを具体的に調べ,Vertex-6での設計のスキルを高めることができた. また.本年度は,音声データベース構築に際し,新たに録音した2名の音声による62文章を4段階の話速で録音したものについて,編集,リップノイズ除去,音量調整などの膨大な作業を行って,2011年11月に新たに240ファイルを公開することができた.昨年度まで作り上げてきた1658ファイルに,本年度の成果を加えると1898ファイルになる.話速を厳密に管理して,複数の話者が,多彩な文章を読み上げるという形式のこれだけ大規模な音声データベースは国内外ともに例がなく,すでに,この分野の研究をすすめる研究者の役にたてるものが出来上がりつつあると考えている.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
「フレキシブルな時間軸による再生機」の研究においては,予定どおりVertex-6を導入することができたこと,Spartax-6に比べて高集積である上,内部のセルや演算部の能力も上であるため,大幅な演算能力向上が期待されていたが,予想どおりの性能が得られることが確認できたこと,そして,予想できなかったような問題点もないことが確認できたこと,などから,おおむね順調に進展していると自己評価した. また,「話速バリエーション型音声データベース」の構築に関しては,録音やその後の編集などで震災の影響を受けて思い通りに進まない面もあったが,夏ごろに集中的に時間をとって手作業による編集をすすめ,この作業に大学院生が全面的に協力してくれたこともあって,予定どおり,集録データを増加させることができた.以上のことより,「音声データベース」の構築に関しても,おおむね順調に進展していると自己評価している. 以上,両者をあわせて,全体としても,おおむね順調と考えている.
|
今後の研究の推進方策 |
当初の計画どおり研究をすすめることを考えている.すなわち,「フレキシブルな時間軸による再生機」の実装の研究と,話速バリエーション型音声データベース」の研究を車輪の両輪ととらえて,話速推定,話速変換,聞き取りやすい音声とはなにか,といったサブ研究テーマにとりくみつつ,最終的な先端的再生機について具体化していく. 同時に,FPGAなどハードウエア技術に関するスキルを高め,組み込み型液晶ディスプレイによる状態表示など,インタラクティブな機能も持たせていきたいと考えている. 「話速バリエーション型音声データベース」については,本研究テーマを終了後も,多くの研究者に利用してもらえるものとしたいので,データベースとして,さらに使いやすいように整理し,ラベルなどメタ情報も一部のデータには付け加えるなどして,ひとりでも多くの研究者に利用してもらいたいと考えている.
|
次年度の研究費の使用計画 |
「フレキシブルな時間軸による再生機」の研究においては,FPA開発ツールのライセンス料が発生する.また,組み込み型液晶ディスプレイによるインタラクティブな操作盤を作成するためにも部品代が発生する.開発ツールを走らせるための計算機であるが,より上位のVertex-6に変更したところ,配置配線に膨大な時間がかかるようになってしまったので,より高速な計算機を導入することを計画している. 「話速バリエーション型音声データベース」の構築に関しては,発声することを職業としているプロフェッショナルなアナウンサー,ナレーターを話者として迎えるために,出演料が必要となる.集音環境を整えるために,防音材などを本年度は補強したい.また,データベースを公開しているサーバーマシンも,すでに数年が経過したのでリプレイスが必要である.その他,研究成果を発表するための論文投稿料も必要となる. 以上のように研究費を使用させて頂くことを計画している.
|