2011 Fiscal Year Annual Research Report
音声認識技術を応用したコンピュータ自動採点日本語スピーキングテストの開発
Project/Area Number |
22242014
|
Research Institution | University of Tsukuba |
Principal Investigator |
今井 新悟 筑波大学, 人文社会系, 教授 (50346582)
|
Co-Investigator(Kenkyū-buntansha) |
山田 武志 筑波大学, システム情報系, 准教授 (20312829)
篠崎 隆宏 千葉大学, 大学院・融合科学研究科, 助教 (80447903)
中村 洋一 清泉女学院短期大学, 国際コミュニケーション科, 准教授 (70326809)
中園 博美 島根大学, 外国語教育センター, 准教授 (40314611)
本田 明子 立命館アジア太平洋大学, 言語教育センター, 准教授 (80331130)
|
Keywords | 日本語教育 / テスト / 教育評価・測定 / 音声情報処理 / 教育工学・教材 / 音声・音韻 / CAT / 自動採点 |
Research Abstract |
【採点】 ・音声データを日本語教師が採点するための基準を作成した。 ・基準に基づいてサンプル問題の採点を行い、評価者間での採点方法の共通理解を確立した後、各問題について3名以上の複数評価者による採点を行った。 【データ収集】 ・昨年度に引き続き、非母語話者の音声データを収集した。 ・非母語話者については当初はある程度発話が期待できる中・上級の学習者を対象としていたが、その結果、教師による採点結果に差がつかなく、受験者の成績の分散が小さくなり過ぎて、機械判定との対照評価がしにくいという弊害が生じた。そのため、年度後半に初・中級学習者からもデータを収集した. ・得られたデータの書き起こし・ラベル付けを行った.それを基に正解パターンを半自動的に生成できるようにした。レベル付きデータが得られたことに音響モデルおよび言語モデル構築のための基礎データの整備が完了した。 【自動判定システムの構築】 教師によってつけられた採点結果を、入力発話から抽出した特徴量を用いて統計的に推定した。特徴量には、キーワード、音響尤度、スピーキングレート(単位時間単語数)、韻律(FO)等を利用した。抽出した特徴量を説明変数、日本語教員3名による採点(0~4点)を目的変数とし、サポートベクター回帰(SVR)によって学習した。音声認識には、アルゴリズムの異なる二つのプログラム(Julius, T3)を併用している。模範解答を、問題作成者があらかじめ作成するとともに、キーワードおよび準キー・ワードを、模範解答から半自動で抽出した上、問題作成者による目視で修正した発音が悪い場合、T3とJuliusの認識結果の異なりが大きくなると仮定し、二つの認識結果の編集距離を特徴量に採用した。特定の設問において、自動採点と日本語教員による採点が著しく隔たる場合がありことが判明した。自動採点の方法・特徴量については検討を続ける。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
震災による被害・対応のため、年度当初、研究が予定通り始められなかった。また、音声文字おこし作業を依頼していた会社において技術者の離職・会社の解散により、他業音への作業移管などがあり、音声文字おこし作業が計画より遅れた。以上の理由のため、本年度の研究計画に遅れが生じた。
|
Strategy for Future Research Activity |
上述のように、研究計画に遅れが生じているため、23年度完成予定であった音響モデル、言語モデルの構築を24年度の早い時期に完成させるように予定を変更する。それに伴い、当初予定していたモニター公開、一般公開の時期を遅らせる。これによって、評価期閥は短くなり、検証が不十分になる懸念があるが、少なくともスピーキングテストの開発という所期の目的は達成できる予定である。
|
Research Products
(8 results)