2013 Fiscal Year Research-status Report
自然言語処理技術を利用した日本語教員養成システムの開発
Project/Area Number |
24652104
|
Research Institution | Hokkai-Gakuen University |
Principal Investigator |
歌代 崇史 北海学園大学, 経済学部, 准教授 (40580220)
|
Keywords | 言語調整 / ティーチャートーク / 教師教育 / システム開発 / 自然言語処理 |
Research Abstract |
本研究は自然言語処理技術を利用し、日本語教員を目指す学生及び教授経験が浅い新人の日本語教員が、様々なレベル・進度のクラスを疑似体験できる日本語教師養成システムを開発することを目的とする。 平成24年度は入力文に含まれる語彙の分析までを可能にしたが、平成25年度では未着手であった文型の分析に着手した。日本語教育における文型の切り分け方と日本語の形態素解析エンジンMeCab(本研究で採用)、ChaSenなどによって切り分けられた形態素とは語のまとめ方が異なる。本研究で開発しているシステムには形態素解析が不可欠であるが、日本語教育に特化した形態素解析エンジンは存在しない。そのため本研究ではMeCabで入力文の形態素解析を行い、その後システム内で日本語教育における文型の切り分け方法に従い、複数の形態素を統合する処理が必要であった。この文型に関する統合処理が適切に動作し、システムの開発目標を達成するための試行錯誤を本年度に繰り返し行った。 現段階でのシステムの動作状況を次に示す。システム利用者が入力した発話文を形態素解析エンジンMeCabで形態素に分け、日本語教育で一般的に採用されている文型の切り分け(本研究では『みんなの日本語』を採用)に統合し、想定された日本語学習者の教科書進度に照らして、それぞれの語彙・文型が既習か未習かを可視化することができる。分析結果は入力発話文に対する既習表現の割合を数値で示し、入力発話に含まれる語彙・文型の量を課ごとにヒストグラムで表示する。さらに、入力発話文に含まれる各語彙・文型が導入される課を一覧表で表示する。開発完了時には複数の教科書に対応することを目指しているが、現在は教科書及び、その範囲を限定し小規模な領域を網羅するシステムを開発している。現段階では『みんなの日本語初級I』の語彙を95.55%程度網羅し、文型は45%程度網羅している。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究は言語処理技術を利用し、日本語教員を目指す学生及び教授経験が浅い新人の日本語教員が、様々なレベル・進度のクラスを疑似体験できる日本語教師養成システムを開発することを目的とする。具体的には、教科書の進度に対応した文型及び語彙のデータベースを構築し、システムと連携させる。システム上では利用者(日本語教員を目指す学生及び新人の日本語教員)が、教室において日本語学習者に対して使う予定の指示、説明のための発話文、及び文型導入のための例文を入力する。利用者が入力した発話文を想定学習者のレベルに基づいてシステムが分析し、フィードバックを即時的に返す。このフィードバックを基にシステム利用者は教室内における言語調整の練習を繰り返し行い、学習者のレベルに応じて使用言語を調整する能力を向上させることを本課題では目指している。 平成24年度は、システム利用者の入力文を解析し、教科書進度に応じたフィードバックを即時的に返すwebシステムの基本部分の開発を目標とし、おおむね達成した。しかし、文型の分析はしておらず、語彙のみの分析に留まった。 平成25年度は前年度に開発したシステムの基盤的機能の拡張に取り組んだ。具体的には、語彙の分析に留まっていた入力文の解析を文型に対応できるよう開発を遂行した。日本語教育における文型の切り分け方と日本語の形態素解析エンジンによって切り分けられた形態素とは語のまとめ方が異なる。例えば、「食べたほうがいい」という表現は、日本語教育では一般に「食べた」(動詞の過去形)+「ほうがいい」に分けて教えるが、形態素解析エンジンMeCabでは「食べ」(動詞)+「た」(助動詞)+「ほう」(名詞)+「が」(助詞)+「いい」(形容詞)と解析される。このような違いを吸収し、システム利用者に有益なフィードバックを返すまでが目標であったが、この目標を達成することができた。
|
Strategy for Future Research Activity |
平成26年度は、平成25年度までに構築したシステムの開発を継続する。具体的には、平成25年度からの課題として、解析の精度の向上、対応教科書の拡大がある。まず、解析精度の向上はシステムの形成的評価も兼ねて、多くの学生にシステムを使用してもらい、解析誤りのデータ収集を行い、誤解析の原因究明と改善を継続的に行う。次に対応教科書の拡大であるが、平成25年度までは『みんなの日本語初級I』のみの対応であったが、平成26年度は『みんなの日本語初級II』まで対応範囲を広げる予定である。対応教科書を拡大するには本課題の平成24年度、平成25年度の開発における技術的知見が応用可能である。そのため、一つの教科書に2年掛かっていた語彙と文型解析の対応が1年で可能と見込まれる。 また、本課題の目的として日本語教員を目指す学生及び教授経験が浅い新人の日本語教員が、本システム利用して教室内言語調整の練習を繰り返すことで、様々なレベル・進度の日本語学習者に応じて言語調整をする能力を向上させることがある。この目的が達成できたか検証するため、システムを使った学習効果を測定する必要がある。具体的には、システムを使った学習をする群としない群では、どれくらい教室内言語調整の適切さが異なるのか、どのように発話が異なるのか、量的及び質的に分析する。さらに、システムを使った学習効果として、教室内言語調整に関する意識変化を量的に測定、分析し、質的にも記述、分析する。 平成26年度は本課題の最終年度である。日本語教育学会、日本教育工学会、日本語教育方法研究会などで発表し、本課題で得られた知見を論文として投稿する予定である。
|
Expenditure Plans for the Next FY Research Funding |
システムの開発が予定よりも少し遅れたため、それに伴う効果検証が次年度に行うこととなった。そのため、システムを利用した学習に関する効果検証実験に必要な物品の購入、実験謝金の支払いが次年度以降となった。 次年度の研究費は次のことに使用する予定である。システム開発、レンタルサーバー、評価実験、資料収集、機材購入、発表のための旅費である。機材としてはシステム提示用PCまたは、タブレット端末3台を予定している。また、システム開発上不可欠なモバイル通信機器の購入と、通信費が必要となる。
|