2018 Fiscal Year Research-status Report
音声セグメント技術を用いた日本語発話学習支援システムの研究
Project/Area Number |
16K00484
|
Research Institution | University of Shizuoka |
Principal Investigator |
松浦 博 静岡県立大学, 経営情報学部, 教授 (60451085)
|
Co-Investigator(Kenkyū-buntansha) |
澤崎 宏一 静岡県立大学, 国際関係学部, 准教授 (20363898)
秀島 雅之 東京医科歯科大学, 歯学部附属病院, 講師 (50218723)
|
Project Period (FY) |
2016-04-01 – 2020-03-31
|
Keywords | 発話評価 / イントネーション / アクセント / 母音の無声化 / 特殊拍 / 基本周波数 / 日本語学習 / 音声セグメント |
Outline of Annual Research Achievements |
日本語学習者および日本語母語話者の発話の実態を多数のデータから求め、その結果を日本語のアクセント・イントネーション等の発話評価のために反映する研究を進めている。従来から取り組んでいる決定木による発話判定では、判定の基準をあらかじめ設定しなければならない。一方、深層学習による発話判定手法は特徴量を自動的に学習することができるため、決定木に対して汎用性と効率性の点で優れている。そこで、日本語学習者の発話判定において新たに深層学習による発話判定手法を取り入れた。実験を通して、十分な訓練データ(150個程度)を備えていれば、局所的なF0系列を入力データとした発話判定の正解率および全体を入力データとした発話判定の正解率が決定木による発話判定の正解率を若干上回ることを確認した。 深層学習の特性についていくつかの比較実験を行った。発話正解率が高くてもそれぞれの発話パターンの適合率に差が生じるということを考え、各発話パターンの適合率が50%を超えるための最小の訓練データの数についても調査した。局所的なF0系列を入力データとした発話判定においては、3値以上の分類においてすべての発話パターンの適合率が50%を超えるためには、少なくともすべての発話パターンの訓練データの数が約5、6個備わっていることが条件であると分かった。訓練データの収集時において各発話パターンの比率が分かっていれば、「最小の訓練データ数 ÷ 最も比率の小さい発話パターンの割合」の数だけ全体の訓練データが必要となると計算できる。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
以下に述べる内容の論文をまとめ、学会に投稿したところ、条件付き採録の判定を受け、現在、修正論文を投稿するべく進めている。 第二言語習得において母語による転移が最も顕著に表れる分野が音声であり、摩擦音/破裂音や清音/濁音をはじめとした音素の誤り、特殊拍(長音・促音・撥音)、母音の無声化、韻律関係(アクセント、イントネーション)など様々な日本語に特徴的な発話が課題となる。日本語学習者にとって習得すべき基準を日本語母語話者のデータから効率的に見出し、その基準を反映した判定を行う発話教育支援システムを開発した。特に、日本語学習者にとって難しい長音・撥音とアクセント核との関係および、母音の無声化、イントネーションについて取り上げ、本システムの有効性を留学生10名に対する実評価実験によって示した。
|
Strategy for Future Research Activity |
現在、条件付き採録の論文を確実に採録されるように対応する。その際、今後の本研究分野の残された課題についても考察を要求されているので、この点についてまとめる。例えば、学習に供するデータ収集の最小化を図る問題や方言の取り扱い、複数の発話課題に対する判定の問題などである。
|
Causes of Carryover |
開発している日本語発話学習支援システムは音声分析システムと判定プログラムから構成される。音声分析システムは毎年、改良を進めてきているが、さらに使い勝手を向上したい。判定プログラムについても完成度を高めていきたい。また、論文誌に投稿し条件付き採録になったので、対応して採録論文に仕上げる。
|
Research Products
(5 results)