研究概要 |
本年度は(1)学習アルゴリズムの評価に関する研究,(2)グラフ構造で表現された知識表現からの学習,(3)動的クラスタリングを利用した情報フィルタリングに関する研究について検討した. まず(1)については,Chernoffの定理を導入して訓練事例のランダムサンプリングを定式化し,平均的事例解析アルゴリズムと統合した.最終的に,Random Case Analysisと呼ぶ評価手法として理論的な定式化を行なった.Random Case Analysisは平均的事例解析と異なり,訓練事例集合の組合せすべてについて期待値を計算することなく,その中の任意の個数の組合せについて期待値を算出する手法をとる.このため,属性数や訓練事例数が増え,訓練事例集合の組合せが非常に大きくなる場合でも,解析に必要な計算時間を非常に小さく抑えることができる. つぎに(2)については,グラフ集合から,「より多くのグラフに含まれかつサイズがより大きい部分構造を発見する」ための評価基準として,グラフの組合せ探索にMDL原理を導入した.また,MDL原理をグラフ集合に適用するために,グラフの符合化方法を検討した.最終的に,逐次的かつ総当たり的なグラフの組合せ探索を行なう,部分構造発見アルゴリズムを開発した. さらに(3)については,領域知識として,大量のWebページから自動的にシソーラスを構築するアルゴリズムを開発した.また,領域知識に含まれるノイズや誤りを修正するために,「失敗からの学習」により漸増的にシソーラスを更新するアルゴリズムを開発した.最終的に,シソーラスを参照しながらWebページを情報フィルタリングするシステムの試作版を開発した.
|