2014 Fiscal Year Annual Research Report
分子表面の三次元データマイニングによるタンパク質機能知識の創出
Project/Area Number |
24300056
|
Research Institution | Kobe University |
Principal Investigator |
大川 剛直 神戸大学, システム情報学研究科, 教授 (30223738)
|
Project Period (FY) |
2012-04-01 – 2017-03-31
|
Keywords | 知識発見 / データマイニング / バイオインフォマティクス / 三次元データ / バイオデータ処理 |
Outline of Annual Research Achievements |
本研究では、タンパク質分子表面を対象としたデータ表現法とそれに基づく三次元データマイニング手法について検討している。平成26年度の主な成果は以下の通りである。 1.タンパク質分子表面の点群表現と高速比較手法:タンパク質分子表面を点群画像として表現し、曲率に基づく特徴点抽出、ならびに周辺点群との関連から特徴量を記述する手法について検討した。また、これをもとに、高速なパターンマッチング処理が可能なメモリ型プロセッサを想定し、そのシミュレータの開発を通して、タンパク質分子表面の局所部位間の網羅的な比較を試みた。60種類のタンパク質を対象とした比較実験により、特定のタンパク質群に固有な特徴的部位の存在が確認されるなど、重要な知見が得られた。 2.最適グラフ発見による結合部位予測とその高速化:タンパク質分子表面をグラフ表現し、これをもとに結合部位を発見する手法とその高速化について検討した。同一リガンドが結合するタンパク質に頻出し、それ以外には頻出でない部分グラフに高いスコアを与える評価関数を導入し、結合部位予測問題を最適グラフ発見問題として定式化するとともに、類似頂点集合を1頂点に集約して再構成した抽象グラフを利用することで処理の効率化を図っている。37種類のタンパク質を対象とした実験の結果、予測に要する時間を約70%に短縮することに成功した。 3.タンパク質構造解析文献を対象とした関連文献検索:タンパク質の機能に関する知見を評価し、あるいは実験対象となるタンパク質データセットを準備するためには、タンパク質の構造について記述された文献の整理が重要となる。そこで、タンパク質構造解析文献から、関連する文献を検索する手法について提案した。Gene OntologyやInterProなどの既存データベースの活用により、タンパク質の機能の観点からの関連性に基づく検索を実現した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
平成26年度の交付申請書に記載した、タンパク質分子表面記述法、ならびに分子表面データの比較・マイニングの高速化に対して、それぞれ具体的な成果が得られている。後者については、高速検索が可能な専用ハードウェアの導入は達成されていないが、汎用サーバ上で動作するシミュレータを開発し、点群の局所的な比較が可能なアルゴリズムの開発作業をシミュレータ上で進めることにより、概ね計画通りの進展が得られた。
|
Strategy for Future Research Activity |
今後の研究方策としては、これまでに提案した手法の一層の高速化を進めるとともに、データマイニングにより発見された局所部位の中から、重要な特徴点を自動選択する手法に注力する。本年度の研究活動を通じて、データマイニングの結果に対して専門的な視点から評価を得る体制を築くことが可能となった。特徴点の重要性を判断するためには、専門知識に基づく解釈が特に重要な役割を果たすため、今後もこの体制を維持することにより、円滑で効果的に研究を推進する予定である。
|
Causes of Carryover |
掲載確定した論文の実際の掲載が平成27年度になったこと、ならびに、国際会議等における研究成果発表を、一部、平成27年度以降に行うことになり、そのための予算確保のため、次年度使用額が発生した。
|
Expenditure Plan for Carryover Budget |
平成27年度掲載となった論文の掲載料については、速やかに使用する。また、次年度の研究費と合わせることにより、いくつかの国際会議や国内学会での研究成果報告を行うとともに、本年度において導入した3種類のサーバ機器の使用効率を高めるため、これらと接続して利用する端末機器やネットワーク機器などを追加導入し、実験環境の一層の整備を進める予定である。
|