既知の事実であるがカーネルとブースティングのモデルとしての等価性をカーネル指数型分布族の視点でまとめた。またその等価性の鍵となるブースティングにおける弱学習機から連想されるカーネル関数を従来指摘されたものからわずかに一般化し、新しい解釈を与えた。この等価性を利用する事で以下の研究成果を挙げた。 最初に弱学習機から連想されるカーネルを連続版へと拡張し、それを用いるとブースティングの弱学習機から新しいカーネル関数が導かれる事を示した。その具体例として決定スタンプ、決定木、線形判別機などの弱学習機からカーネル関数を導出した。ただしこの内決定スタンプと線形判別機は既知のカーネル関数を導く。しかしそれらのカーネル関数の基底関数がブースティングの弱学習機と一致することは初めて指摘された。これらのカーネル関数についてはその性質を基底関数の性質から論じることも可能になった。 また新しい正則化ブースティングを導出した。これは上記のブースティングの弱学習機とカーネルマシンの正則化を組み合わせた方法になっている。この方法はいわばカーネルマシンにブースティングのモデルを導入した方法になっている。しかし提案法と同じモデルを用いたカーネルマシンも考えることができ、その場合提案法がカーネルマシンの性能を上回るわけではないが、提案法は関数勾配降下法を用いているため遺伝子発現データのような高次元の場合でも計算的に実行可能である。 ブースティングの判別関数の複雑さを視覚的に捉える試みを行った。上述の弱学習機から連想されるカーネルを用いるとブースティングの判別関数をグラム行列の視点で視覚的に捉えることができる。これらの観察はカーネル自身も単純な関数から始めてブースティングのように複雑なものへと更新していくことがいくつかのデータで有効であることが示された。 上述の成果の有効性をシミュレーションデータにより確認した。また実データを用いた実験としてUCI及びDELVEベンチマークデータセットについても適用し、従来法より有効に働く例も少なくないことを確認した。
|