1997 年度実績報告書

インターネットを利用した教育支援システムの構築と評価

研究課題

研究課題/領域番号	07680413
研究機関	東京理科大学
研究代表者	溝口文雄東京理科大学, 理工学部, 教授 (50084463)
研究分担者	難波和明東京理科大学, 理工学部, 講師 (10228108) 大和田勇人東京理科大学, 理工学部, 講師 (30203954)
キーワード	電子ドキュメント / 自動分類 / 帰納学習 / インターネット / WWWブラウザ
研究概要	電子シラバスのような大量の電子ドキュメントを自動的に構造化することは情報検索やデータマイニングの重要な課題であり,本研究では帰納学習に基づいてドキュメントを自動分類することに焦点を当てた. 本研究では帰納学習システムへの入力情報として有効に使えるキーワードをTFIDF(Term Frequency Inverse Document Frequency)理論を用いて選択し,キーワード間の関連性も考慮した分類規則を求めるために英語語彙データベースWordNetを利用して,キーワードの上位概念もドキュメントに関する情報として抽出した.そして,電子メールの自動分類を実験対象に,本手法により生成されたデータセットを学習システムに提供し,実験を試みた.個別データとして4名,時系列データとして720通の電子メールに適用した結果,分類精度が向上することが示された. また,従来の方法と違って,ドキュンメントの分類先を既知とした訓練データを必要としない,すなわち,ドキュメントの分類先を全く指定せずに,ドキュメントの分類を可能にする方法を提案した.具体的にはドキュメントを特徴付ける属性(例えば,キーワードなど)の選択と帰納学習を並行的に処理し,帰納学習による分類の整合度の高い属性の組合せを求めた.この組合せがドキュメントの分類先となる.実験結果により,分類先を既知とした分類精度とほぼ同等の精度が得られた.これより,本方法は人の負担をかけずに電子ドキュメントを分類するものと言える.

研究成果
(1件)

すべてその他

すべて文献書誌 (1件)

[文献書誌] 冨宅秀幸, 大和田勇人, 溝口文雄: "教師なし学習による電子ドキュメントの自動分類" 第56回情報処理学会全国大会論文集. (発表予定).