研究概要 |
知識獲得に用いる上述の高速アルゴリズムでは,アルゴリズムで用いられるパラメータを予め設定する必要があるが,それらは経験的に与えているのが現状である.アルゴリズムの評価においても,同じパラメータに対して異なるアルゴリズムによる導出結果に対する比較評価に主眼が置かれており,獲得された知識に対する客観的な評価方法は,まだ完全には確立していない.本研究では,獲得された知識を客観的に評価する判断基準を確立し,それを基にパラメータの設定により獲得される知識の性能評価を行い,各種アルゴリズムにおいて最良の知識獲得が行えるパラメータの設定判断基準を与えることを目的とし研究を行った. 制御分野の信号処理で「警告漏れ」と「誤警告」のような警告エラーにおける閾値に関する研究としてROC(Receiver Operating Characteristics)解析があるが,この手法を,Web文書や文献情報などの半構造データからの知識獲得を行う各種アルゴリズムに対して「検索漏れ」と「誤検索」に着目して適用し,経験的な判断基準の設定を必要としない知識獲得アルゴリズムの研究開発を行った. 研究開発した手法を実際的なデータに基づいて定量的に評価するため,Webデータおよび文献二次情報データに対しての性能評価を行い,適用手法が様々なタイプのデータに適用可能となるように一般化を行った.その結果,知識として有用であるかの判断基準を設定することが可能となり,その判断基準を基にして最も知識として有用と考えられるルール導出が可能なアルゴリズムの開発が確認された.また,開発したアルゴリズムが効率よくノイズを自動的に除去可能であることが確認され,未知の情報に対しての情報フィルタリングとして機能することも併せて確認することができた.
|