研究課題
基盤研究(B)
本研究は、タンパク質の分子表面データを対象とした三次元データマイニングを実現するための分子表面表現法とデータマイニング手法に関する基礎的検討を実施したものであり、その成果の要約は以下の通りである。1.三次元画像特徴量を用いたタンパク質分子表面比較タンパク質の構造情報ならびに疎水性や静電ポテンシャルなどの物性情報から得られる三次元表面画像を対象として、三次元SIFTとPoint Feature Histogramを併用した局所特徴量表現を導入し、これをもとにタンパク質分子表面に存在するポケット間の類似度を評価する方法を提案した。比較的小規模なデータセットを対象としたタンパク質結合部位予測問題に対して提案手法を適用した結果、データセットのおよそ半数において、第1位として結合部位を正確に予測できていることから、局所特徴量の妥当性を確認した。一方で、順位の低いデータに対する分析の結果、特徴点間の対応付けにおいては、特徴点の位置関係が重要であることが明らかとなった。2.最適グラフ発見によるタンパク質結合部位予測タンパク質分子表面のグラフ表現データをもとに、最適グラフ発見によりタンパク質結合部位を予測する手法を提案した。提案手法では、異なるグループ間でリガンドが類似している場合に最適グラフが必ずしも結合部位にならない点に留意し、グループ統合処理とそれを前提とした枝刈り方法ならびに評価関数を導入している。これにより、グループ統合無と統合有を同時に探索することが可能となり、個別に探索する場合に比べて、計算コストの削減に成功している。また、グループ統合を考慮することにより、予測精度向上を達成した。
2: おおむね順調に進展している
研究実施計画に掲げたタンパク質分子表面の三次元画像的取り扱いのための表現方法について提案し、その妥当性を示す小規模な実験も実施できていることから、概ね計画通りの進展と言える。
当初の研究実施計画に従い、データセットを大規模化・多様化を図ることにより、導入した特徴量表現の分析を進めるとともに、グラフ表現との統合への展開を図る。
本年度はデータセットが小規模であり、既存の計算機環境の利用が可能であったため、新たなサーバ機器の導入を実施していない。次年度の研究費と合わせることにより、大規模データセットを利用した実験に対応可能な環境を整備する予定である。
すべて 2013 2012
すべて 雑誌論文 (2件) (うち査読あり 2件) 学会発表 (6件)
Lecture Notes in Bioinformatics
巻: Vol. 7845 ページ: 81-94
10.1007/978-3-642-38342-7_8
International Journal of Bioscience, Biochemistry and Bioinformatics
巻: Vol. 3, No. 3 ページ: 182-186