2006 Fiscal Year Annual Research Report

隠れマルコフモデルを用いた自己組織化写像の拡張及びプロモータ配列の推定

Research Project

Project/Area Number	05J02795
Research Institution	The University of Tokyo
Principal Investigator	西尾泰和東京大学, 大学院新領域創成科学研究科, 特別研究員(PD)
Keywords	三角不等式 / 自己組織化写像 / 隠れマルコフモデル / 教師なし学習
Research Abstract	隠れマルコフモデルを用いて拡張された自己組織化写像は教師なし学習を行うニューラルネットの一種である。この自己組織化写像のニューロンに隠れマルコフモデルなどの教師有り学習の能力を持つ内部構造を持たせる拡張について、いくつかのモデルに従ってランダムに生成されたデータおよび実際の生物学的実験から得られたデータに対して行った実験により、ユーザーが注目したい特徴について三角不等式を満たす距離を定義できるかどうかが重要であると言うことが判明した。注目する特徴について定義した距離関数が三角不等式を満たさない場合には、自己組織化写像などで学習した結果がデータの順序などに大きく影響を受けるようになり、生物学的な意味に乏しい巨大なクラスタなどが発生してしまうため、クラスタリング結果が有益な情報を持たない。本研究が目指していた、DNAなどの配列における特徴的な配列パターンとそのパターンの位置情報、パターン間の相対的な位置関係などについてのクラスタリングを行う上で、それら配列パターンなどとその配置を対として、その間に距離を定義する場合、素朴な定義では三角不等式を満たさないため、当初予定していた自己組織化写像のおのおののニューロンに隠れマルコフモデルに従う教師有り学習能力を付与することで大規模な配列データから情報抽出を行う方法で生物学的に価値のある結果を得ることは困難であることが判明した。