本年度において、ある用語に対する学習問題文生成を自動化するシステムを特に、形態素解析と係り受け解析に注目して構築した。このシステムは以下の4ステップによって構成されている。 1. インターネットから用語に対するHTMLデータを取得する。 2. 取得したHTMLデータから説明文を検索し、知識情報を抽出する。 3. 抽出された知識情報から正しいもの、適したものをシステムが自動選択する。 4. 選択された知識情報から、問題文を生成する。 さらに、正解候補を取得したHTMLデータから係り受け解析によって探索し、表示する。このシステムにより、ある用語に対して学習問題文と正解候補の作成が可能になった。以上から、ある用語に対する学習問題文自動生成という課題が解決した。 しかし、正解候補がどれくらい望ましいものか、という参考情報に乏しいため、複数表示した際に最終的にどれを正解にすればよいのかがわかりにくいものになっている。次年度では、正解候補に対する「確かさ」を数値化し、利用者に対してより適切な情報を提示するシステムへと発展させる予定である。また、自動作成された学習問題文の妥当性についても、文章解析の観点から同様に「確かさ」を表示するシステムとしたい。
|