2019 Fiscal Year Research-status Report
人工知能で目指すアミノ酸配列類似性検索法の高速化および高感度化研究
Project/Area Number |
18K18143
|
Research Institution | Tohoku University |
Principal Investigator |
山田 和範 東北大学, 情報科学研究科, 准教授 (20756217)
|
Project Period (FY) |
2018-04-01 – 2021-03-31
|
Keywords | 配列解析 |
Outline of Annual Research Achievements |
本研究ではLSTMを用い,大量のPSSMを網羅的に学習することで,1本のアミノ酸配列からPSSMを生成する手法,SPBuildを開発した.開発手法のPSSMの生成に要する計算量は配列長に対し線形であり,高速にプロファイルを生成可能であった.また,本研究で開発した手法によって生成させたプロファイルで,配列類似性検索法の感度を測定したところ,BLAST,CSBuild,RPS-BLAST等の既存の類似性検索法より高い感度を示した.本手法は,プロファイル比較法をはじめとする下流の解析法に応用することで,その計算時間の短縮および性能向上に寄与することが期待される. 本年度は,本手法のサーバー化に取り組んだ.これまでに,サーバー上で正常に動作が行われることを確認し,また,公開サーバーのインターフェースのチェックを行った.また,本手法を構築する際の深層学習アーキテクチャ,LSTMは大量のパラメータを必要として計算コストが大きいため,これを減らすために新たなアーキテクチャの開発に取り組んだ.文脈を考慮できるアーキテクチャのひとつに再帰的ニューラルネットワークがある.このうちのLSTMを今回の開発に用いたが,これに対して大体4分の3のパラメータを有するアーキテクチャがGRUである.本研究ではさらに,パラメータ数を減らすことで,LSTMの半分以下,また,GRUの3分の2以下までにパラメータ数を減じかつ予測性能がそれらと同等なアーキテクチャを構築した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
これまでに開発した手法のサーバーとしての公開や学習アルゴリズムの改善に取り組むことを継続し,特段の問題は生じなかったため.
|
Strategy for Future Research Activity |
最終年度では開発手法をサーバーとして公開させることを完了させる.また,改善した学習アーキテクチャによって再度学習を行い,プロファイル生成のための計算時間を減らすことを目指す.
|
Causes of Carryover |
今年度は予定通りの予算の執行ができたが,昨年度の持越しの分が余っている.来年度,計算機の購入の予定が生じた場合に購入する予定である.
|