研究概要 |
今年度は分散・統合データ解析の基本要素となる問題設定と理論の二つの側面からの定式化に関する研究を行った.まず問題設定については,今まで研究されてきた嗜好パターンに基づいた協調フィルタリング法を参加システムごとにグループ分けし,それぞれの嗜好パターンが異なる場合にどのように分散・統合処理をすればよいかについて問題の定式化を模索し,神嶌と赤穂がいくつかの可能性を考え研究会において発表・議論した.その結果,確率的な設定を考えると,自然に情報幾何学的アプローチが有効やあることが示唆された. 次に,理論については,従来赤穂によって行ってきた研究が頻度主義的な確率論に基づくもので,少数サドプルについては有効性が出ない場合もあるという議論を踏まえ,少数サンプフレでも有効性の高いベイズ推定の枠組みで情報幾何的なデータ解析手法ができないかを検討した.その結果,ベイズ推定の定式化は可能だが,そのままでは解析的な計算が困難であることがわかった.そこで,ベイズ推定を近似的に行うために,変分ベイズ法とラプラス近似を組み合わせることによって計算量の面でも有利な手法を開発し,実際に簡単な確率分布をクラスタリングする場合について東京大学のグループと共同で計算機プログラムを作成し,実験的な有効性の確認作業に着手した. これらの成果により,大規模な環境下での協調フィルダリングに情報幾何学的なアプローチを適用する可能性が広がり,さらにベイズ的なアプローチも導入することが可能となった.
|