研究課題/領域番号 |
23520721
|
研究機関 | 早稲田大学 |
研究代表者 |
近藤 悠介 早稲田大学, オープン教育センター, 助教 (80409739)
|
研究分担者 |
中野 美知子 早稲田大学, 教育・総合科学学術院, 教授 (70148229)
|
キーワード | 国際情報交換(台湾) / 言語テスト / 自動採点システム / 英語学習 |
研究概要 |
平成23年度に引き続き、英語学習者の発話データベースを構築するために、日本および台湾の英語学習者から発話データを収集した。データ収集に用いた発話誘出タスクは談話完成タスクを用いた。このタスクはヨーロッパ言語参照枠に基づいており、平成23年度ではA2レベルに対応するもの約130問を作成し、このタスクを用いてデータを収集したが、本年度ではB1、B2、C1、C2に対応するタスクを作成した。このうちB1およびB2レベルのタスクを用いて発話データを収集した。収集した発話データは平成23年度に約10000発話のデータを収集したが、本年度も約10000の発話を収集した。膨大なデータの収集、分析のために談話完成タスクのWeb化を簡便にするソフトウェア、発話の書き起こしのためのソフトウェアの開発に着手した。 発話音声データの認識のために、TIMIT Acoustic-Phonetic Continuous Speech CorpusおよびERJデータベースを援用して音響モデルを作成し、収取されたデータの書き起こしから言語モデルを作成し、その認識精度を検証した。項目の種類によって精度にばらつきはあるが、単語認識においてはおおむね良好な結果が得られた。音素認識は学習者の発話の特徴量を抽出するレベルの精度ではなかったため、音響モデルの学習において異なる方法を検討し始めた。 発話自動採点システムの構築においては人間の評定者による評価と学習者の発話の特徴量との関係を検証し、予測式を得る。この段階において多くの評定者による評価が必要である。この人的コストを軽減するため、評価値が付与された少ない発話データから評価値が付与されていない発話データの評価値を予測する方法を検討した。これにはEMアルゴリズムを用いた。EMアルゴリズムによって予測された評価値と実際の評価値の相関係数は.64でありその有用性が確認された。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
平成23年度より行ってきた発話データ収集において多くのデータが集まり、音声認識のための言語モデルおよび音響モデルの作成を検討した。また、最終年度で構築する自動採点システムで採用する予測方法を検討した。
|
今後の研究の推進方策 |
平成24年度までに収集した発話データに評定者による評価値の付与を依頼し、その評価値と関係の強い発話の特徴量を抽出し、特徴量から評価値を予測する方法を検討する。得られた予測式をもとに発話自動評価システムを構築し、算出する評価値の精度を評価する。
|
次年度の研究費の使用計画 |
おもに成果発表のための学会出張、データ提供者への謝金、データ整理のための研究補助者への謝金のために使用する。
|