2014 Fiscal Year Research-status Report
日本語学習者データマイニングのための既存ツール評価とマニュアル設計
Project/Area Number |
25580109
|
Research Institution | Kanazawa University |
Principal Investigator |
松田 真希子 金沢大学, 国際機構, 准教授 (10361932)
|
Co-Investigator(Kenkyū-buntansha) |
林 良子 神戸大学, 国際文化学研究科, 教授 (20347785)
渡部 倫子 広島大学, 教育学研究科(研究院), 准教授 (30379870)
金田 純平 国立民族学博物館, 文化資源研究センター, 研究員 (10511975)
|
Project Period (FY) |
2013-04-01 – 2016-03-31
|
Keywords | アクセント / テキストマイニング |
Outline of Annual Research Achievements |
本年度は(1)音声データマイニングの基礎技術の開発(2)テキストマイニングの教育応用の検討(3)マニュアル設計を行った。(1)については、日本語母語話者と中国語母語話者による日本語朗読音声を対象に,音響特徴に基づいてアクセント型を自動判定する方法を検討した。さらに,その精度を検証するため,人による判断と比較した。まず,形態素解析ソフトの mecab(辞書Unidic)を用いて朗読テキストから形態素と 品詞情報を抽出し,文節の境界を決定した。 次に,音声認識システム Julius を用いて, 各朗読音声を対象に文節および文節内での音素でアライメントを行った。そして,各文節内の V・VC・/N/から音響特徴の抽出を行い,直前の値との差を計算することで,当該文節内でのアクセント核(ア核)位置を求めた。用いた音響特徴は,各セグメントの F0 平均値(f0mean)・ 中央値(f0median)・外挿値(f0target)である。読み上げ音声については日本人判定者との一致率が最も高かったのは日本語、中国語母語話者ともにf0target(日本語音声70%、中国人音声75%) であった。このことから,f0target(外挿値)がアクセント判定において代表値として頑健であることが示された。不一致の多くは無核を有核と判定するケースや,人判定から前後 1モーラ分ずれて判定しているケースであった。(2)については日本語学習者のFacebook誕生日メッセージをコーパス化し、日本語母語話者との使用傾向の異なりを比較したり、日本語学習者の英語レポートをコーパス化して分析し、日本語能力との相関を分析した。(3)についてはQAサイトを立ち上げ、マイニングの教育応用を測るための試作品を作製した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
基礎技術開発(音声データマイニング)と教育応用(マニュアル作成)の両面に渡り研究成果が得られたため。基礎技術については最終年度までに応用化には至らない可能性があるが、基礎研究としての貢献はなしえると予想される。マニュアル化については最終年度で完成の予定である。
|
Strategy for Future Research Activity |
(1)データマイニングマニュアルのためのQAサイトを公開し、情報提供を行い、データの蓄積をはかる (2)音声の自動評価技術開発を続ける
|
Causes of Carryover |
物品費に若干の余裕が生じたため
|
Expenditure Plan for Carryover Budget |
消耗品に使用予定
|
Research Products
(10 results)