研究実績の概要 |
本年度は(1)音声データマイニングの基礎技術の開発(2)テキストマイニングの教育応用の検討(3)マニュアル設計を行った。(1)については、日本語母語話者と中国語母語話者による日本語朗読音声を対象に,音響特徴に基づいてアクセント型を自動判定する方法を検討した。さらに,その精度を検証するため,人による判断と比較した。まず,形態素解析ソフトの mecab(辞書Unidic)を用いて朗読テキストから形態素と 品詞情報を抽出し,文節の境界を決定した。 次に,音声認識システム Julius を用いて, 各朗読音声を対象に文節および文節内での音素でアライメントを行った。そして,各文節内の V・VC・/N/から音響特徴の抽出を行い,直前の値との差を計算することで,当該文節内でのアクセント核(ア核)位置を求めた。用いた音響特徴は,各セグメントの F0 平均値(f0mean)・ 中央値(f0median)・外挿値(f0target)である。読み上げ音声については日本人判定者との一致率が最も高かったのは日本語、中国語母語話者ともにf0target(日本語音声70%、中国人音声75%) であった。このことから,f0target(外挿値)がアクセント判定において代表値として頑健であることが示された。不一致の多くは無核を有核と判定するケースや,人判定から前後 1モーラ分ずれて判定しているケースであった。(2)については日本語学習者のFacebook誕生日メッセージをコーパス化し、日本語母語話者との使用傾向の異なりを比較したり、日本語学習者の英語レポートをコーパス化して分析し、日本語能力との相関を分析した。(3)についてはQAサイトを立ち上げ、マイニングの教育応用を測るための試作品を作製した。
|