研究課題/領域番号 |
20K00610
|
研究機関 | 東京国際大学 |
研究代表者 |
波多野 博顕 東京国際大学, 言語教育機構, 准教授 (10709364)
|
研究期間 (年度) |
2020-04-01 – 2023-03-31
|
キーワード | 日本語アクセント / 機械学習 / 自動評価 / 音響分析 |
研究実績の概要 |
2020年度は、当初計画のうち主に「関連文献・先行研究のレビュー」「音声データの収集と分析単位の切り出し」を行った。コロナ禍により「アクセント型評価実験」が思うように行えなかったため、以下に述べるようにデータ収集対象を工夫したうえで「音響分析と機械学習の実施」も今年度に行った。 音声データの収集では、既存のコーパスに加えて市販の日本語教材で音声データが付属されているものを中心に検討・収集した。日本語教材は日本語学習者が聴取・練習する際にモデルとなるように収録されているため、アクセント型の正解情報が最も信頼できる音声素材と考えた。これにより、日本語母語話者による音声ではあるが、アクセント型の評価実験が行えない問題点を修正することを試みた。日本語教材から、データ量が比較的多く音声のバラエティーが豊富な日本語教科書5冊を選定し、3,589の音声素材を得た。これらを単語単独発話・文単位発話・会話や、モーラ別・男女別に分類して整備した。 そのうち、今年度は3モーラの単語単独発話815に限定して分析を行った。音響分析によってアクセント型別に基本周波数や持続時間など各特徴量を抽出し、それらを用いて機械学習を行った。アクセント型自動評価モデルの検討は、先行研究と同様にサポート・ベクター・マシンで行った。分析の結果、日本語母語話者による3モーラ語のアクセント型自動評価で、正解情報と約90%の一致率を得た。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
新型コロナウィルスの感染拡大の影響により,アクセント型の評価実験や学習者音声の収集が予定していた通りに行えなくなってしまったため。
|
今後の研究の推進方策 |
対面で学習者音声を収集する機会は今後も難しいことが予想されるため、音響分析に適した素材を既存のコーパスから詳細に検討・分析していくことを考えている。
|
次年度使用額が生じた理由 |
新型コロナウィルス感染拡大の影響により、予定していた学会参加に伴う旅費、および、実験実施による人件費・謝金の支出が行えなかった。 2021年度では、遠隔での実験実施環境を調査・整備した上で、実験の実施を検討する計画である。
|