研究課題/領域番号 |
23500170
|
研究機関 | 東京大学 |
研究代表者 |
巖淵 守 東京大学, 先端科学技術研究センター, 准教授 (80335710)
|
研究期間 (年度) |
2011-04-28 – 2014-03-31
|
キーワード | 国際情報交流(イギリス) / 自然言語処理 / 音声合成 |
研究概要 |
初年度である23年度は,本研究に応用される既存の合成音声技術についての調査を行った。その結果,例えばインドにおける複数の言語に対する合成音声ソフトの開発が進むなど,途上国における合成音声技術の母語対応が徐々にではあるものの進展も見られることが明らかになった。しかし,一方ではマレーシアのように,母語であるマレー語の合成ソフトの研究は存在するものの,一般の人がそのソフトウェアを利用する状況には至っていないことも明らかになった。多くの国々では,英語など,既存の合成音声ソフトが対応した言語を理解できる人がその言語のOS環境でのみ合成音声ソフトを利用することに限られるが現状である。またそうした国々では,スペックの低い廉価なパソコンや携帯電話向けの合成音声ソフトを利用する例が増えつつあり,マイノリティ言語の合成音声技術開発に関しては,将来の利用を想定して,こうした途上国において利用が進む情報技術環境に合わせた開発が求められることが明らかになった。 本年度は,あわせて既存合成音声ソフトの発音調節を可能とするためにバックグラウンドで動作するテキスト取得・変換用のモジュールソフトを開発した。これによって,キーボードによる入力文字や画面上に表示されたテキストを取得することが可能となった。今後,このモジュールをベースに,テキストデータを対象言語に合わせた形に変換し,既存合成音声ソフトに渡す前の処理を行うことを予定している。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
初年度である23年度は,既存の合成音声ソフトを利用して新しい言語へと適応させる統計的手法の基盤を構築する予定であった。しかし,合成音声に関する既存技術の調査から,テキストデータを音へ変換するという各合成音声ソフトが備える固有のルールを,新たな言語に可能な限り言語にとらわれない形で構築するためには,当初想定していなかった言語処理の検討も必要であることが明らかとなった。そのため,初年度の進捗がやや遅れた。
|
今後の研究の推進方策 |
今後,対象となるマイノリティ基本音素と既存合成音声ソフトウェアの言語の文字表現をつなぐSound-to-Letter(音素列を文字列表現に対応させる)の音声変換ルールの候補の探索方法の検討を進め,その統計的手法の有効性の確認をする予定である。これまでの成果も踏まえ,母音・子音をはじめとする音素を多く含み,かつ発音がテキスト表現に比較的忠実であるといった基準となる合成音声ソフトウェアの利用により,評価が比較的容易である日本語,英語を中心に作業を進める。また,構築される理論枠組みを適用した試験用合成音声システムを作成し,実験を通して新しい言語への適用性を確認する。また,既存合成音声ソフトウェアが持たない対象マイノリティ言語に含まれる音への対応として,今後検討する手順とは別に,(1)音の追加が可能なオープンソースの既存合成音声ソフトウェアの利用,(2)綴りの調整による擬似的な音による補償,(3)録音音声の利用の有効性についての検討をあわせて進める予定である。
|
次年度の研究費の使用計画 |
平成24年度は,上記計画を進める上で必要となる研究補助(データの分析補助,整理)に対する謝金を計画している。また,研究発表を目的とした国内外の学会参加のための旅費を計画しており,これら2つの項目によって研究費の大半は占められる。その他,開発を進める上でのソフトウェア等購入のための消耗品費等を計画している。
|