2015 Fiscal Year Research-status Report
糖鎖機能解明のための機械学習モデル開発及び糖鎖プロファイルデータベースの構築
Project/Area Number |
26330333
|
Research Institution | Soka University |
Principal Investigator |
木下 聖子 創価大学, 理工学部, 教授 (50440235)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | 糖鎖インフォマティクス / アラインメント / 確率モデル |
Outline of Annual Research Achievements |
本研究の目的は、糖鎖の木確率モデルを開発し、それを用いて糖鎖を認識する分子の糖鎖認識パターンを学習し、データベース化することである。そして本年度は新しい木確率モデルを開発するための基礎的な開発を進めた。木確率モデルのProfilePSTMMの入力に糖鎖構造群以外にステートモデルが必要ある。ステートモデルとは、出力のパターンの形を決めるもので、木のトポロジーとして扱う。以前は、入力の糖鎖構造の最大共通部分木をステートモデルとして利用していたが、小さな糖鎖構造が入力された場合、ステートモデルも小さくなってしまう問題があった。
そこで本研究において、木確率モデルの学習に必要となる木のステートモデル決定方法に、木のマルチプルアラインメントを用いてきた。MCAW (Multiple Carbohydrate Alignment with Weights)と呼ぶ方法を考案し、ウェブツールを開発した。しかし、本研究の実行中に糖鎖構造のアラインメントが正しくない結果になってしまうことに気づき、tree edit distance(木の編集距離)を用いる必要があるとわかった。そこで、本年度は新たに木編集距離を用いた木のマルチプルアラインメントを行うアルゴリズムとウェブツールを開発した。このツールを用いることで糖鎖の妥当なマルチプルアラインメントが可能となるため、現在はMCAWとの比較を行った結果を論文にまとめている。
今後、木編集距離を用いてステートモデルを決定し、ProfileOTMMと呼ぶ新たな木確率モデルを開発する予定である。また、ProfileOTMMで学習されたモデルをデータベース化する計画である。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
木確率モデルのProfilePSTMMの入力に糖鎖構造群以外にステートモデルが必要ある。ステートモデルとは、出力のパターンの形を決めるもので、木のトポロジーとして扱う。そこで本研究において、木確率モデルの学習に必要となる木のステートモデル決定方法に、木のマルチプルアラインメントを用いてきた。MCAW (Multiple Carbohydrate Alignment with Weights)と呼ぶ方法を考案し、ウェブツールを開発した。しかし、本研究の実行中に糖鎖構造のアラインメントが正しくない結果になってしまうことに気づき、tree edit distance(木の編集距離)を用いる必要があるとわかった。そこで、本年度は新たに木編集距離を用いた木のマルチプルアラインメントを行うアルゴリズムとウェブツールを開発することになった。このツールを用いることで糖鎖の妥当なマルチプルアラインメントが可能となると考えられる。従って、予定していた木確率モデルProfileOTMMの開発はまだ始まっていない。最終年度でProfilePSTMMを開発するため、予定していたデータベース開発は難しいと予想している。
|
Strategy for Future Research Activity |
今後は木編集距離を用いたステートモデル決定を行うプログラムを開発し、ProfilePSTMMより精度の高く効率の良い木確率モデルであるProfileOTMMを新たに開発する。そしてウェブツールとして、入力された糖鎖構造を用いてステートモデルを決定し、ProfileOTMMを実行し、モデル学習を行うソフトウェアを開発する。また、様々な糖鎖アレイデータベースやレクチンアレイのデータを用いて、学習されたモデルをデータベース化する予定である。なお、学習されたデータベースは自動的に更新できるようなシステムとして開発するため、セマンティック・ウェブ技術を用いて開発する。
|
Causes of Carryover |
今年度はソフトウェア開発及び解析のみで研究が進んだため、データベース構築の費用が発生しなかった。
|
Expenditure Plan for Carryover Budget |
次年度はデータベース構築まで進められたら開発を行いたいと考えている。その場合、データベース用のサーバー及びハードディスクの購入が必要になる。
|