研究概要 |
本研究では,マルチスケールシミュレーションの基盤構築を目的とし,フィジオーム・システムバイオロジーにおけるシミュレーションにて利用するための異分野データベースの統合に関する研究を行った.本研究ではまず遺伝子およびタンパク質の関連に着目し,タンパク質立体構造データベース,Protein Data Bank(PDB)を検索するために,遺伝子関連語彙情報オントロジーであるGene Ontologyの単語を機能アノテーションとした検索手法について開発を行った.PDBでは既にGene Ontologyの語彙が付与されているが,付与されていないエントリも数多くある。そのためタンパク質配列データベースであるUniversal Protein Research(UniProt)を利用し,タンパク質配列とそれに対応したGene On tologyの語彙の参照用データベースを構築し,補完した機能アノテーションの妥当性について評価した.また本研究ではマルチスケールシミュレーションで利用するためのデータ構造を定義するin-silico Markup Language(ISML)の語彙情報,in-silico Ontology(ISMO)と複数のデータベースやオントロジーを統合検索するメタオントロジーの設計と提案を行った.メタオントロジーでは,複数の言語体系であるオントロジーの共通項を探し出し,関連する語彙を探索することを可能にする,これにより複数の分野にまたがった統合的なデータベース検索が可能となり,例えばチャネルイオンタンパク質に関連する遺伝子,タンパク質,生体現象などの探索が可能になると考えられる.
|