研究課題/領域番号 |
15K02738
|
研究機関 | 同志社大学 |
研究代表者 |
山本 誠一 同志社大学, 理工学部, 教授 (20374100)
|
研究分担者 |
馬田 一郎 国立研究開発法人情報通信研究機構, ユニバーサルコミュニケーション研究所多感覚・評価研究室, 研究員 (40374110)
|
研究期間 (年度) |
2015-04-01 – 2020-03-31
|
キーワード | CALL / 音声認識 / 第二言語 |
研究実績の概要 |
本研究では、複数人での会話に学習者の参加を促す第二言語学習の環境であるJoining-in-conversationsの環境を設定し、複数人の会話で言語運用能力の低い参加者は運用能力の高い参加者の表現を借用する傾向があるという現象Interactive alignment現象を利用することにより、言語運用能力を向上させる音声対話型のCALLシステムの実現方法を研究することを目的としている。 本年度は、2台のHumanoidタイプの会話エージェント間の会話シナリオを設定し、その会話の一部の質問を学習者にも行う実験環境を開発し、この実験環境で50名の被験者の発話データを収集、分析を行った。学習者がHumanoidタイプの会話エージェントの発話の表現をどの程度借用するかの指標として、単語単位での編集距離を測定した結果、約60%の値を示し、学習者がHumanoidタイプの会話エージェントの発話の表現をかなりの頻度で借用することが示された。
以上の発話データの収集結果の分析に基づき、本研究対象のCALLシステムの提案と本システムで収集された音声データの分析結果を電子情報通信学会で発表するとともに、テキスト・音声のコーパスに関する2016年5月に開催される国際学会Language Resources and Evaluationに投稿・採択された。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
第1段階の主要項目は複数人での会話分析であり、160セットの会話データの収集を目標としている。現在までに、第二言語での会話を自由会話、課題会話各々について20セット(計40セット)収集し、英語母語話者と言語運用能力の高い第二言語話者との会話に続いて、言語運用能力の低い第二言語話者が会話を行うという形式で更に質問形式を指定した会話20セットを収集した。また、第2段階での会話データの収集の予備収集として、エージェントとの会話データを20セット収集した。今後、目標数の達成に向けて収集を進める予定である。
言語モデル開発の前段として、学習者が会話エージェントの発話の表現をどの程度借用するかの指標として、単語単位での編集距離を測定した結果、約60%の値が得られた。また、どのような表現に対してインタラクティブ・アライメント現象、すなわち、表現の借用が生じやすいかについて予備検討を進めた結果、一部の表現は他の表現に変換される現象を見出した。この現象を考慮して、二重目的語を取る構文は単一目的語を取る構文で表現されやすいなどの結果に基づき、一部の表現については類似表現を考慮した言語モデルの開発を行う必要があるなどが判明した。言語モデルの開発に際してはこれらの知見を取り入れることを目指すこととした。
|
今後の研究の推進方策 |
現状、コミュニケーションモデルの検討やコーパス収集などの一部の計画に遅れは見られるものの、全体としては当初計画にほぼ沿って進捗していると考えられるため、当初計画によって研究を進めることとする。
なお、研究分担者の馬田一郎氏が2016年4月1日付けで民間企業の研究所に異動となったため、4月1日から連携研究者となり、研究推進力の若干の低下は免れないため、研究課題のプライオリティの変更を検討中である。
|