研究概要 |
本年度は,次のことを行った. 1.係り受け情報と統計情報を融合した情報検索システムの性能評価 2.テキストの再利用性と,ユーザの学習到達度を考慮したタグ付きテキストからの問題自動生成システムの試作 3.電子メールの質問に対する自動応答システムの精度向上 1では,昨年度開発した語の確率情報と,係り受け情報を融合した情報検索手法の精度向上手法について研究を行った.この手法では,更に,概念辞書を利用した質問文の拡張と,省略語の照応(ゼロ代名詞の照応)も行うが,質問文の拡張時に,質問文中の語の意味を考慮することは難しいため,誤拡張を行うことがある.そのため,拡張された語(拡張語)が検索時に利用された時の精度と,質問文中の元の語(元語)が利用された時の精度を調べ,その正解率を,拡張語と元語の重み付に利用した所,それぞれの重みを一様にした場合に比べ,検索精度が向上することがわかり,また,その精度が,対話システム構築時の自然言語インタフェースとして利用するに十分であることを確認した. 2では,学生の学習到達度に合わせた問題を自動生成するための仕組みを開発した.本手法は,学習用テキストに埋め込まれたタグの情報と,学生の学習履歴情報を基に,学生の到達度の推定と,タグ付けされた問題の難易度の推定を行う.本研究では,そのための,タグの設計と,学生の到達度や問題の難易度の推定式の提案,および,その評価用のシステムを試作した.問題自動生成に利用されるタグは,今後,ますます広がって行くと想定されるインターネットを利用した教育システム開発を考慮して,XML形式を取る.これにより,従来,ネットワーク上で利用されていた電子テキストを,テキストとしてだけでなく,問題生成用にも利用することが可能となった. 3では,識別の難しかった短い質問文に対する応答性について,その精度を上げるために,類似度計算手法の改良と,同義語についての対策を行った.また,1で開発した手法の精度向上を確認したことから,現在,この手法を適用するために検討を行っている.
|