2012 Fiscal Year Research-status Report
マイノリティ言語向け合成音声システム開発のための効率的音声適応手法の構築
Project/Area Number |
23500170
|
Research Institution | The University of Tokyo |
Principal Investigator |
巖淵 守 東京大学, 先端科学技術研究センター, 准教授 (80335710)
|
Keywords | 国際情報交換 / 自然言語処理 / 音声合成 |
Research Abstract |
平成24年度は,本研究に応用される既存の合成音声技術についての調査を引き続き行うとともに,それらを利用して新たな言語の基本音素を再現するための方法について検討を行った。その結果,近年の音声処理技術を用いたユーザーインタフェースに対する関心の高まりや,実際にスマートフォンやタブレットPC等と連携するシステムの利用の広がり等に伴う技術的進展が見られ,本研究においても,それら技術動向に合わせた検討が求められることが明らかとなった。 そこで,昨年度開発した,既存音声ソフトの発音調整をするためにバックグラウンドで動作するテキスト取得・変換用のモジュールソフトの機能追加・更新を行った。これにより,新しいパソコン用OSにも対応するとともに,昨年度のままではエラーが発生していたキーボードによる入力文字や画面上に表示されたテキストの取得が,安定して行えるようになった。 また,このモジュールをベースに,テキストデータを対象言語に合わせた形に変換し,既存合成音声ソフトに渡す前の処理を行うことを検討した。具体的には,対象となる言語の基本音素と既存合成音声ソフトの言語の文字表現をつなぐSound-to-Letter(音素列を文字列表現に対応させる)の音声変換ルールの候補の探索方法についての考察を進めた。頻出音素を対象に探索を進める方法の有効性は示されるものの,各言語特有の発音ルールへ対応できる言語処理など,依然として理論面で不十分な点も多く残されることが明らかとなった。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
平成24年度は,既存の合成音声ソフトを利用して新しい言語へと適応させる統計的手法を構築するとともに,音の追加が可能なオープンソースの既存合成音声ソフトウェアの利用,綴りの調整による擬似的な音による補償,録音音声の利用の有効性についての検討を進める予定であった。しかし,テキストデータを音へ変換するという各合成音声ソフトが備える固有のルールを,新たな言語に可能な限り言語にとらわれない形で構築するためには,それぞれの内容について当初想定していなかった言語処理の検討が合わせて必要となり,そのため,本年度の進捗がやや遅れた。
|
Strategy for Future Research Activity |
今後,対象となるマイノリティ言語の音声変換ルールの候補の探索方法について引き続き検討を行い,ネイティブスピーカーの実験協力者を含めた実験を行いながら,本研究における統計的手法の有効性を確認する。また,得られた理論枠組みを適用したプロトタイプシステムを作成し,他言語への適用方法とその理論的枠組みについての考察を進める。ここでは,各言語特有の発音ルールへの対応における問題点ついても明確にしておく必要がある。 あわせて,上記プロトタイプシステムを用いて,既存の合成音声ソフトウェアが対象としていないマイノリティ言語に含まれる音への対応として,(1)音の追加が可能なオープンソースの既存合成音声ソフトウェアの利用,(2)綴りの調整による擬似的な音による補償,(3)録音音声の利用の有効性等について,さらなる検討を進める。 また,以上これまでの研究結果を基に,既存の合成音声技術を用いてカバーできる音声的特徴と,その問題点について整理し,技術的対応に関する提言としてのまとめを行う。
|
Expenditure Plans for the Next FY Research Funding |
平成25年度は,上記計画を進める上で必要となる研究補助(データの分析補助,整理)に対する謝金を計画している。また,研究発表を目的とした国内外の学会参加のための旅費を計画しており,これら2つの項目によって研究費の大半は占められる。その他,開発を進める上での消耗品費等を計画している。
|
Research Products
(2 results)