2008 Fiscal Year Annual Research Report
フレキシブルな時間軸を持つ高効率音声再生法の研究と研究者用音声データベースの作成
Project/Area Number |
20500111
|
Research Institution | The University of Electro-Communications |
Principal Investigator |
高橋 弘太 The University of Electro-Communications, 電気通信学部, 准教授 (10188005)
|
Keywords | 音声データベース / 話速推定 / 効率的視聴 / モーラ / 原稿提示システム / アナウンサー |
Research Abstract |
本年度の研究目標は、(1)アナウンサー用原稿提示装置の製作、(2)プロのアナウンサーに朗読を依頼しての集音、(3)収録した音声の予備的公開、(4)収録した音声を用いた実験、であった。 (1)については、ReCoK5という原稿提示システムを研究組織内で開発し、改良を進め、実用に耐えうるレベルまで完成度を高めた。さらに、開発したソフトウエアを一般に公開し、他組織の研究グループに利用してもらえるようにして、話速の研究が音声研究の中で一分野として成立できるように準備を整えた。(2)については、プロのアナウンサー3名を2回にわたって呼び、話速を制御したうえでの録音を行った。読み上げ原稿は、ATRから提供されている研究者用の原稿を利用した他、新聞社と交渉し、新聞コラムの記事も用いた。(3)についても予定どおり進行した。収録した音声は編集し、組織外の研究者も利用できるように公開した。現在、http://www.it.ice.uec.ac./SRV-DB/SRV-DB_release.htmlで、SRV-DBというデータベース名で公開している。(4)については、本データベースを利用した研究例として話速の自動推定の研究を進め、推定誤差など、定量的な評価まで行えるようになった。 全体を総括して、ほぼ予定どおりに進行したと言える。特に、ReCoK5を使うことで、予想以上に高品質な収録を効率的に行うことができた。SRV-DBも、予備的公開の予定であったが、すでに、他の研究者の方々に利用して頂ける状態になっており、アクセスも伸びている。
|
Research Products
(4 results)