2021 Fiscal Year Research-status Report
機械学習を用いた日本語アクセント自動評価技術の検討
Project/Area Number |
20K00610
|
Research Institution | University of Tsukuba |
Principal Investigator |
波多野 博顕 筑波大学, 人文社会系, 助教 (10709364)
|
Project Period (FY) |
2020-04-01 – 2023-03-31
|
Keywords | 日本語アクセント / 機械学習 / 自動評価 / 音響分析 |
Outline of Annual Research Achievements |
2021年度は、当初計画通り「関連文献・先行研究のレビュー」を引き続き進めるとともに、「音響分析と機械学習の実施」の分析成果をまとめ2件の研究発表を行なった。 機械学習によるアクセント型判定モデルを構築するため、前年度と同じく市販の日本語教育関連教材に収録されている音声データについて、更に拡充・精査を行なった。そのうち、各アクセント型が比較的豊富に揃っている2・3モーラ語を対象に音素区間のアライメントを行ない、区間内で基本周波数(fo)の値と時間情報から回帰直線を計算した後、当該直線上に参照点を設定し、それらを線形補間することで全体的なfo形状のモデリングを行なった。これにより、foの欠損やマイクロプロソディの影響を受けにくいピッチ曲線が得られた。 モデリング結果に基づき、前年度の分析を踏まえて新たに音素区間内のfo平均値や傾きなど、機械学習に入力する各種の特徴量を選出・計算した。また、前年度ではサポートベクターマシン(SVM)のみであった機械学習の手法についても、今年度ではKNNやランダムフォレスト、ロジスティック回帰、SVMなどの各種手法を組み合わせたスタッキングを用いて精度の改善を試みた。 教材が示すアクセント型を正解ラベルとする教師あり学習によって判定モデルを構築し、それを用いて新規データのアクセント型を予測した結果、2モーラ語(0型、1型の判定)で約95%、3モーラ語(0型、1型、2型の判定)で約94%の正解率となった。 従来は判定モデル構築のために別途音声の収録を想定していたが、今回のように市販の日本語教育教材の付属音声という既存のリソースであっても十分な精度が出た。音素のアライメントを含め、本研究の判定にかかる全ての工程は自動化されていることから、今後の音声自動評価研究の進展が期待できる結果となった。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
研究開始時はコロナによる大きな影響を受けたものの、今年度は研究予定内容を漸次遂行するとともに、これまでの研究内容を取りまとめて発表することができたため。
|
Strategy for Future Research Activity |
構築したアクセント型判定モデルが学習者音声ではどのような結果となるのかを検討する。そのために、これまで既に収集している素材を含め、更に学習者音声データを集めてアクセント型の評価を行ない、これをテストデータとして最終的なモデル評価を行なう。また、これまでの内容を論文にまとめ、研究全体を総括する。
|
Causes of Carryover |
関連学会や研究会等が引き続きリモートで開催され、予定していた旅費の支出がかなわなかったため、次年度使用額が生じた。本年度は多くの日本語教材に付随する音声資料を収集し、未だに未整備のものも含まれるため、それらに対するラベリング等、研究補助の謝金としての使用を予定している。
|