2012 Fiscal Year Research-status Report
自然言語処理技術を利用した日本語教員養成システムの開発
Project/Area Number |
24652104
|
Research Category |
Grant-in-Aid for Challenging Exploratory Research
|
Research Institution | Hokkai-Gakuen University |
Principal Investigator |
歌代 崇史 北海学園大学, 経済学部, 准教授 (40580220)
|
Project Period (FY) |
2012-04-01 – 2015-03-31
|
Keywords | 教育工学 / 教材 / 教材メディア / 日本語教育 / 教師教育 / 日本語教員養成 / webシステム / 自然言語処理 |
Research Abstract |
本研究は自然言語処理技術を利用し、日本語教員を目指す学生及び教授経験が浅い新人の日本語教員が、様々なレベル・進度のクラスを疑似体験できる日本語教師養成システムを開発することを目的とする。 平成24年度は、システム利用者の入力文を解析し、教科書進度に応じた適切性を判定するためのシステムの基盤となる部分を開発した。システムのデータベースは日本語教科書の『みんなの日本語I』を採用した。この教科書は日本国内、海外で多くの教育機関が採用しているため、利用者が多いという点からデータベースの資料として適切である。教科書は課に分けられ、それぞれの課で学習する語彙と文型が明示されている。これらの各語彙、文型に導入課のタグ付けを行った。 現段階でのシステムの動作状況を次に示す。システム利用者が入力した発話文をシステムが形態素に分け、想定された日本語学習者の教科書進度に照らして、それぞれの語彙・文型が既習か未習かを可視化することができる。分析結果は入力発話文に対する既習表現の割合を数値で示し、入力発話に含まれる語彙・文型の量を課ごとにヒストグラムで表し、想定学習者の学習状況に発話の語彙・文型レベルが適しているかシステム利用者が判断可能となる。さらに、入力発話文に含まれる各語彙・文型が導入される課を一覧表で表示する。これらの分析及び結果の表示により、学生及び新人教員に言語調整の必要性を理解させ、調整が必要な語彙・文型をそれぞれの想定発話文に応じて特定することができる。開発完了時には複数の教科書に対応することを目指しているが、現在は開発初期段階であるため教科書及び、その範囲を限定し小規模な領域を網羅するシステムを開発している。現段階では『みんなの日本語初級I』の語彙を95.55%程度網羅し、文型は今後の開発において対応予定である。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究は自然言語処理技術を利用し、日本語教員を目指す学生及び教授経験が浅い新人の日本語教員が、様々なレベル・進度のクラスを疑似体験できる日本語教師養成システムを開発することを目的とする。具体的には、教科書の進度に対応した文型及び語彙のデータベースを構築し、システムと連携させる。システム上では利用者(日本語教員を目指す学生及び新人の日本語教員)が、教室において日本語学習者に対して使う予定の指示、説明のための発話文、及び文型導入のための例文を入力する。利用者が入力した発話文をデータベースと連携したシステムが、その適切性を想定学習者の能力レベル・教科書の進度に応じて判断し、フィードバックを即時的に返す。 平成24年度は、システム利用者の入力文を解析し、教科書進度に応じた適切性を判定するためのデータベースを構築し、フィードバックを即時的に返すwebシステムの基本部分の開発を目標とし、おおむね達成した。しかし、現段階では文型の処理はしておらず、語彙のみの分析に留まっている。文型の分析に関しては次年度の課題とする。対象とした教科書の語彙の網羅率は95.55%であるが、解析誤りが発生する場合もあることから、解析精度を上げる方策を次年度以降取る必要がある。
|
Strategy for Future Research Activity |
平成25年度は、平成24年度に構築したシステムの開発を継続する。具体的には、平成24年度から引き継いだ課題として、文型への対応と解析の精度を向上させることがある。まず、文型への対応に関しては引き続き『みんなの日本語I』をデータベースとし、言語処理の視点から文型の分類を行い、処理の難易度が容易なものから開発に着手する。語彙と同様、文型にも教科書の導入課のタグ付けを行いう。本年度の作業目標は日本語教科書『みんなの日本語I』における語彙・文型を網羅的に処理できるシステムの構築である。目標達成のためには文型処理の網羅率を90%以上にしたい。もう一つの課題として、解析精度の向上があるが、これに関してはシステムの形成的評価も兼ねて、多くの学生にシステムを使用してもらい、解析誤りのデータ収集を行い、誤解析の原因究明と改善を継続的に行う予定である。
|
Expenditure Plans for the Next FY Research Funding |
次年度の研究費は次のことに使用する予定である。システム開発、データベース作成、評価実験、資料収集、機材購入である。機材としては、システム提示用PCまたは、タブレット端末3台を予定している。また、システム開発上不可欠となるモバイル通信機器の購入と、通信費が必要となる。
|