本研究の成果の概要は以下のようにまとめられる。 1. ブースティングの性能に関する情報幾何的解析 ブースティング及びカーネルマシンはカーネル指数分布族の視点で統合的に解釈が可能である。ここで弱学習機が連続パラメトリックモデルと仮定すると、そのモデルがある意味で平坦であればブースティングは弱学習機を改良しないことは容易にわかる。しかし弱学習機のモデルが曲がっていたとしても、強すぎる弱学習機を選択したときブースティングは汎化誤差の意味で弱学習機を改悪することを示した。 2. 線形判別機カーネル 昨年度までに得られた線形弱学習機カーネルは厳密には判別機ではなく線形関数より導出されていた。本年度は厳密に線形判別関数を用いた弱学習機カーネル関数を導出した。 3. ブースティングカーネルマシンと遺伝子データ解析への応用 この研究では全体を通してブースティングとカーネルマシンを統合した方法をいくつか提案した。その中の最も有望と思われるアルゴリズムをBKMと呼ぶ。BKMのパラメータ推定の一致性は強い仮定のもとで証明できることを示した。今後この研究はBKMの変数選択の意味での一致性を明らかにすることが期待される。またマイクロアレイデータを用いて特定の表現形に関連する遺伝子を推定した。この研究の推定された遺伝子の検証は計画されていなかった。しかし別の研究において同じ表現形の異なるマイクロアレイデータにより検証実験を行うことが可能となった。このためこの研究は推定された関連遺伝子の検証研究へと継続されている。 4. ブースティングとクロスバリデーションを組み合わせた変数選択法 副産物としてブースティングとクロスバリデーションを組み合わせた変数選択法を提案した。この方法は汎化誤差を下げる仕組みがBKMとは異なっておりBKMと対比してどのような性質をもつのかを明らかにしていくことが期待される。
|