2015 Fiscal Year Annual Research Report
学習者話し言葉コーパスに基づく学習支援システムに関する研究
Project/Area Number |
15H02940
|
Research Institution | Kansai Gaidai University |
Principal Investigator |
小谷 克則 関西外国語大学, 外国語学部, 教授 (30440994)
|
Co-Investigator(Kenkyū-buntansha) |
吉見 毅彦 龍谷大学, 理工学部, 准教授 (50368031)
井佐原 均 豊橋技術科学大学, 学内共同利用施設等, 教授 (20358881)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | 英語学習 / 話し言葉 / コーパス |
Outline of Annual Research Achievements |
本研究は英語学習支援システムの要素技術を確立するために、 (1)学習者話し言葉(聴解、発話)コーパスの作成、 (2)教材の難易度を文単位で推定する技術の開発と検証、 (3)学習者が習得していない語彙や文法を検出し,学習者の言語能力を推定する技術の開発と検証に取り組む。 平成27年度は学習者話し言葉コーパスの作成を中心に研究活動を行った。 まず、学習者コーパスの仕様などを検討した。この検討を通じて学習者に聞かせる英語母語話者の音声データ(母語話者データ)の内容や音声学的な特徴を定めた。そして、学習者がどの程度適切に英語を聞くことができたかを確認する方法を定めた。また、学習者のどのような発話を 音声データ(学習者データ)として収集するかを検討した。この検討結果得られた母語話者データと学習者データの仕様や学習者の聴解の確認方法の有用性を関連学会における発表を通じて確認した。 次に、学習者コーパスの構築手法を検討した。一般的な学習者コーパスの構築手法として、授業における学習者の運用を通じてデータを収集するといった手法がある。この手法の利点として、多数の学習者からデータを収集できるといったデータ収集効率の良さがある。しかし、その一方で、ケアレスミスや集中力の途切れといった不本意な運用によるデータの介入といった問題が生じる。本年度の学習者コーパスから学習者の最善の運用を示す統計的な特徴を抽出し、これらの統計的な特徴は先述の要素技術の開発の利用に供する。そこで、不本意な運用などの介入をできるだけ排除する必要があった。 そこで、授業内ではなく、有償実験としての環境下においてデータ収集を行った。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
本研究の基本版要素技術開発と検証に必要な参照データとしての学習者話し言葉コーパスの収集を終えた。このデータ収集において、データ収集機器の操作不具合により若干のデータ収集ミスが発覚した。そのため、新たに被験者(該当データ分二人)を準備し、データ収集を行ったため、若干の遅れが発生した。但し、こうした再実験は予期されていたため、本質的な計画の遅れにはつながらなかった。
|
Strategy for Future Research Activity |
平成27年度に収集した学習者話し言葉コーパスデータに基づき教材の難易度や学習者の言語能力を推定する技術の開発と検証を行う。 まず、学習者話し言葉コーパスに学習者による言語運用結果の良さを評価した結果を注釈として付与する。この注釈データは学習者の運用の成否を示す評価結果である。評価を通じて、語彙・表現の発音と文法の適切性を注釈情報として付与し、誤用に対してはその誤用の種類(発音:発音漏れ、不要な発音の追加、異なる発音との置換、文法:必要な語彙・表現の抜け、不要な語彙・表現の追加、異なる語彙・表現との置換)などの情報も注釈として付与する。また、各文に複数の英語教員の主観評価値も付与する。 次に、注釈付きコーパスデータを用いて教材の難易度と学習者の運用精度を推定する技術を開発する。こうした要素技術の開発では、語彙、文法、発音といった様々なレベルにおける言語的特徴がどのように学習者の聞きやすさや発話のしやすさに影響を及ぼすかを統計的にモデル化する。こうしたモデルに基づき、学習者にとっての英語音声の聞きやすさ、そして英語による発話のしやすさを推定する。 最後に、学習者話し言葉コーパスデータの収集効率を高めるデータ収集法を検討する。 学習者話し言葉コーパスデータ収集効率が高まり、恒常的にデータ収集を行えると、学習者の日々遷移する習得過程を反映したデータの収集が可能となる。こうした英語習得の長期的なデータに基づき教材の難易度推定、言語能力の推定技術を開発することで、より精緻な推定を行うことができる。
|
Research Products
(8 results)