研究概要 |
主に以下の2つの結果を得た. 1)冗長な次元を削減する効果を導入したベイズ判別器の統計力学的開発 ベイズの公式に基づく推論はその有用性が認識されている一方で,多くの場合,計算困難を伴うため実現が難しい.この困難を解決する実際的近似アルゴリズムの開発は,推論結果に対する性能評価と並んで最も統計力学に期待が寄せられている研究課題である.本研究では,特に,生命情報解析などの実データ解析で必要となる冗長次元の削減という問題に対し,ベイズ統計の枠組みを有効利用するための近似アルゴリズムの開発を行なった.考察した課題は以下のようなものである.高次元の入力データに対し,それを2つのカテゴリに分ける分類問題を考える.ただし,実問題を念頭におき,i)データの中には分類規則に関係しない冗長な次元が含まれるが,それはあらかじめ分からない,ii)データ数を増やすことはコストがかかるため,高々,次元数と同程度の少数のデータに基づき判別規則を抽出しなければならない,とする.このような状況に対する素朴な対処法として,各次元に対してそれが推論規則に関係する有意な次元か,そうではない冗長な次元かを1または0で表現する刈り込み変数を導入し,判別のためのパラメータと合わせた変数に対する事後分布に基づきベイズ推論を行なう判別器を提案した.このような判別器は変数の刈り込みに関する総ての組み合わせを考慮しなければならないため,計算困難を伴う.そこで,信念伝搬を基に,データの発生源に関するある種の仮定の下,実際的な近似アルゴリズムを導出した.統計力学的解析より,得られたアルゴリズムは導入した仮定が満たされる場合はほぼ最良の推定効率を達成することが示された.また,マイクロアレイデータを用いた大腸がん組織の分類問題に応用し,実問題への有効性も確認した. 2)平均場型近似アルゴリズムに対するレプリカ拡張の定式化 レプリカ法は,従来,配位平均を伴う熱力学的極限での性能評価に用いられることが多く,それ以外への応用はほとんどなされていない.本研究では,配位平均を伴わない有限自由度のサンプル系に対するレプリカ法を発展させた.具体例として,1つのサンプル系に対するベーテ近似をレプリカ拡張することにより,さまざまな近似アルゴリズムを導出できる枠組みを与えた.
|