研究概要 |
本研究の目的は項目応答理論で与えられるデータマイニングモデルを基礎とし、そこにデータ間の相関をマルコフ確率場の知見を参考に導入し、データマイニングのための新たな確率モデルを提案することである。 (1)データ間の相関を考慮できる確率的データマイニング理論体系の構築と整備 (2)頑健な結果を得るための統計的近似理論の整備 本年度は上記(1)・(2)に関わる重要な結果を得ることに成功した。大量のデータがランダムネスを伴いながら強い相関をもつ場合、そのデータを扱うにはこれまでの方法論では不十分であり、データの統計性を深く考慮したモデリングと計算アルゴリズムが必要になる。本年度は統計力学のスピングラス研究分野の知見に基づき、その種のデータに対する具体的な計算アルゴリズムを開発し、統計的学習理論・データマイニングへの具体的な応用への足掛りをつくることができた。本年度の成果は統計力学とデータサイエンスを従来よりも強く結びつけるきっかけになりえるため、単に性能の良いアルゴリズムを構築したという意味だけでなく、学際領域に位置する本研究分野としての学術的な意義も重要である。 本年度の研究成果は田中和之教授(東北大学)、樺島祥介教授(東京工業大学)、Remi Monasson教授(Laboratoire de Physique Statistique de l'ENS,フランス)らの助言の下、本報告書記載の学術会議において報告しており、本年度得られた成果のいくつか関する学術論文も現在出筆中である。
|