2010 Fiscal Year Annual Research Report

フレキシブルな時間軸を持つ高効率音声再生法の研究と研究者用音声データベースの作成

Research Project

Project/Area Number	20500111
Research Institution	The University of Electro-Communications
Principal Investigator	高橋弘太電気通信大学, 大学院・情報理工学研究科, 准教授 (10188005)
Keywords	音声データベース / 話速推定 / 効率的視聴 / モーラ / 原稿提示システム / 原稿提示システム
Research Abstract	本研究の目的は,2つある.第一の目的は、単位時間あたり最高の効率で日本語音声を聴き取らせる再生速度設定での再生を実現する方法の確立である.第二の目的は,第一の目的のための研究を円滑に行うための特殊な音声データベースを製作し,Webページを用いて一般に公開し,広く全国の研究者の役に立ててもらい,この分野の研究を促進することである. 本年度は,第一の目的を達成するために,昨年より製作してきた再生システムに最終的な修正を加え,鸚鵡返しでの再生もでき,かつ,常に音信号を長し続けるモードでの再生もできるシステムとして完成させた,これによって,話速変化も加味して再生速度を適応的に変化させることの有効性を示すことができた.また,独自に開発して話速推定アルゴリズムが十分実用になることも実証できた. また,本年度は,以上に加えて,第二の目的を達成するために,以下の研究を行った.まず,最も力を入れたのは,音声データベースの完成と公開である.本年度は,昨年度収録した音声に極僅かなエラーがあったため,その修正から作業にとりかかった.修正作業は,音声データベースを少しでも良いものにするために万全を期したものにしたため,そのアルゴリズムは研究としても一定の程度の価値のあるものとなり,平成23年7月に査読付き論文として公表できることとなった.これは,本研究の中では副次的効果ではあるが成果の一部である.その他,音声データベースには,音声だけでなく背景の音楽を付加したものも独自に作成した.また,あらたに話者2名を呼び,1日かけて,4種類の話速での音声採取も行った.さらに,原稿提示システムも改良し公開した.以上により,全国の音声研究者が無料で利用できる「話速バリエーション型音声データベース(SRV-DB)」が完成した.

Research Products
(2 results)

All Presentation (1 results) Remarks (1 results)

[Presentation] 視聴覚コンテンツにおける音声の高品位な時間軸伸縮法2011
- Author(s)
  蔦木圭悟高橋弘太
- Organizer
  電子情報通信学会・コミュニケーションクオリティ研究会
- Place of Presentation
  やすらぎ伊王島(長崎県
- Year and Date
  2011-03-08
[Remarks]
- URL
  http://www.it.ice.uec.ac.jp/SRV-DB/