研究課題/領域番号 |
24652115
|
研究機関 | 東京大学 |
研究代表者 |
広瀬 啓吉 東京大学, 情報理工学(系)研究科, 教授 (50111472)
|
研究期間 (年度) |
2012-04-01 – 2014-03-31
|
キーワード | 韻律体系化 / 非母語音声 / 生成過程モデル / 音声合成 / 発音教育CALL / 基本周波数パターン / 単語アクセント / 音声変換 |
研究概要 |
母語話者の発話の韻律の言語間比較とともに、特に日本語の韻律に関する発音教育を中心として研究を進めた。まず、日本語、英語、中国語の母語話者音声コーパスを、海外研究者の助力を得て取得し、その基本周波数パターンの分析を、生成過程モデルにより進めた。その結果、英語については、従来、音源強度、音素持続時間との関連が強いとされる強勢、弱勢の表現に、基本周波数パターンが大きく関係し、生成過程モデルにより強勢、弱勢が良好に区別されること、中国語については、各声調が、正、負あるいは両者の結合した指令により良好に表現され、談話の焦点は指令の絶対値により表わされることなどを明らかにした。また、統語といった、アクセント型等と比べて広い範囲に渡るフレーズの特徴は、指令の生起頻度に違いが見られるものの、基本的に言語間の差異が少ないことを明らかにした。なお、これと関係して、観測される基本周波数パターンに対し、生成過程モデルによる分析(指令の抽出)を自動で行う新しい手法を開発した。非母語話者(学習者)の発音については、日本語発音を収集し、単語アクセント型、長母音、促音などの特殊拍音素における発音誤りを調査した。その結果、学習者の母語の影響が基本周波数パターンに現れること、特殊拍音素は対応する通常音素の発音に影響を与えることなどを示した。また、学習者の発音誤りを整理した上で、基本周波数パターンを系統的に変更した合成音声を作成し、母語話者による拍単位のピッチ上昇、下降判断境界を聴取実験によって求め、学習者の発音の判定を行う手法のプロトタイプを構築した。特殊拍音素については、持続時間を制御した合成音声を作成し、同様の実験を行った。音声合成については、生成過程モデルの枠組みで、韻律変換を行うシステムの改良を行い、特に焦点付与を実現した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
非母語音声の韻律の定式化に時間を要しているものの、韻律の言語間比較に関して研究実績概要に述べたような事項を明らかにした。日本語については、非母語音声の韻律的特徴を念頭に置いて基本周波数などを制御した音声合成による聴取実験により、どの程度のどういった誤りが、アクセント型知覚に影響するかを明らかにし、発音教育システムへの反映を進めている。基本周波数の分析や、音声合成における制御では、指令自動抽出、韻律変換で国際会議に発表するなど、予想以上の進展を見ている。
|
今後の研究の推進方策 |
初年度の合成音声を用いた知覚実験において、特に日本語の単語アクセントの誤りの許容度を定量的に明らかにした。これをもとに非母語音声の自動評価手法を構築する。さらに、HMM音声合成やGMM音声変換を活用して、種々の韻律的特徴(と分節的特徴)を、精密に制御した合成音声を得、知覚実験により、非母語音声の韻律的特徴を明らかにする。日本語の単語アクセント型、英語のストレス、中国語の声調型の内、特に、日本語について焦点を当てて研究を進める。HMM音声合成やGMM音声変換の高度化も進め、非母語音声を、声質を保ったまま、発音誤りを修正して再合成する手法を開発する。これらを統合して、発音教育システムの構築に結び付ける。なお、海外協力研究者のWentao Gu教授(Nanjing Normal University)はNICTの招へい研究員として6月から、広瀬の研究室に滞在することになっており、日本語と中国語音声の韻律比較、中国人日本語学習者あるいは英語学習者の韻律分析において、効果的な議論が期待できる。なお、東京大学の峯松教授に協力する形で日本語アクセント型オンライン辞書OJADを開発しており、発音教育システムの構築に際しては、その活用も考慮する。
|
次年度の研究費の使用計画 |
パーソナル計算機を購入し、CALL(発音教育)システムを構築する。 消耗品のうち、計算機用記録媒体は、DVD-R、USBメモリ等で、音声データ、分析・実験結果、開発アルゴリズムなどの保存・受け渡し用である。印刷用消耗品は、プリンタ用のトナーカートリッジと用紙である。成果発表用に論文別刷りを支出する。また、音声コーパスを入手する為の費用を支出する。 合成音声の聴取実験のために聴取実験謝金を支出する。また、音声の収録、アルゴリズムの開発・実装、実験の遂行に実験補助謝金を支出する。さらに、実験結果の整理のために資料整理の謝金を支出する。翻訳・校閲は、国際会議を含め、海外への論文投稿に際しての、英文校閲を想定している。 研究打合せは、研究代表者が連携研究者の河合剛准教授(北海道大学)、協力研究者のJianHua Tao教授(CAS、北京)他と打合せを行うものである。研究成果発表としては、国内では、日本音響学会全国大会、電子情報通信学会音声研究会等、海外では、ISCAのINTERSPEECHあるいはSLATE等を予定している。雑誌論文への投稿も予定している。このため研究成果発表費用(と論文別刷代)が必要になる。
|