本研究の目的は項目応答理論で与えられるデータマイニングモデルを基礎とし、そこにデータ間の相関をマルコフ確率場の知見を参考に導入し、データマイニングのための新たな確率モデルを提案することである。 (1)データ間の相関を考慮できる確率的データマイニング理論体系の構築と整備 (2)頑健な結果を得るための統計的近似理論の整備 本年度(繰り越し分)は特に(2)についての重要な成果を得ることができた。強い複雑なランダムネスを伴ったシステムに対するレプリカ理論とよばれる物性分野で成功を収めてきた数学理論を当該研究の焦点である確率モデルの計算理論に取り入れることで、従来よりも安定した計算アルゴリズムの構築に成功した。 また、確率伝搬法と呼ばれる強力な統計的近似計算理論に統計力学でよく知られている線形応答理論を組み合わせた「感受率伝搬法」に独自の工夫を加え、より高性能な統計的近似計算アルゴリズムの開発に成功した。本年度の成果は統計力学とデータサイエンスを従来よりもより密接に連携させていくことにより成し遂げられたものであり、その意味では学際領域に位置する本研究分野としての学術的な意義も十分にもつものと考えられる。 本年度の研究成果は主に田中和之教授(東北大学)、樺島祥介教授(東京工業大学)らの助言の下遂行されたものであり、本報告書記載の学術論文・学術会議において報告しており、さらに本年度得られた成果のいくつかに関する学術論文もさらに現在出筆中である。
|