2018 Fiscal Year Research-status Report
人工知能で目指すアミノ酸配列類似性検索法の高速化および高感度化研究
Project/Area Number |
18K18143
|
Research Institution | Tohoku University |
Principal Investigator |
山田 和範 東北大学, 情報科学研究科, 准教授 (20756217)
|
Project Period (FY) |
2018-04-01 – 2021-03-31
|
Keywords | 人工知能 / 文字列 / 配列類似性検索 / 生物学的配列 |
Outline of Annual Research Achievements |
アミノ酸プロファイルまたは位置特異的置換行列 (position specific scoring matrix (PSSM)) は対象のアミノ酸配列の各座位における進化情報を内包する行列データである.配列類似性検索や進化解析をはじめとする様々な下流の解析に用いられており,バイオインフォマティクスの研究に必要不可欠である.その構築過程で,対象配列を雑多な配列データベースに対して繰り返し検索する必要があるため,構築時間はデータベースのサイズに依存する.そのため,昨今の利用可能な配列データの爆発的な増加によって,PSSMの構築には大量の計算時間が必要となっている. そんな中,深層学習が様々な研究分野で注目を集めている.中でも,長短期記憶 (LSTM) は時系列 (文脈) という,自然界に存在する最も基本的なデータ構造のひとつを学習できる枠組みであり,機械学習の範疇に収まらず,人工知能をはじめとする様々な分野で応用されている.アミノ酸配列を配列たらしめる最も基本的な要素のひとつはその文脈であるが,その観点からLSTMはアミノ酸配列の機械学習に適した枠組みであるといえる. 本研究ではLSTMを用い,大量のPSSMを網羅的に学習することで,1本のアミノ酸配列からPSSMを生成する手法,SPBuildを開発している.開発手法のPSSMの生成に要する計算量は配列長に対し線形であり,高速にプロファイルを生成可能であった.また,本研究で開発した手法によって生成させたプロファイルで,配列類似性検索法の感度を測定したところ,BLAST,CSBuild,RPS-BLAST等の既存の類似性検索法より高い感度を示した.本手法は,プロファイル比較法をはじめとする下流の解析法に応用することで,その計算時間の短縮および性能向上に寄与することが期待される.
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
2018年までに手法を開発し,既に論文化(Yamada KD, Kinoshita K, De novo profile generation based on sequence context specificity with the long short-term memory network, BMC Bioinformatics, 19(1):272, 2018)を達成したため.また,2017年に開催された生命医薬情報学連合大会では口頭発表を行い研究奨励賞(Yamada KD, Kinoshita K, Development of de novo generator of amino acid sequence profile using LSTM framework, IIBMP2017, 2017)を獲得したため.
|
Strategy for Future Research Activity |
これまでに,人工知能技術を利用してたった1本の配列からアミノ酸プロファイルを生成する画期的な手法を世界に先駆けて開発することに成功した.今後は,本手法を界隈に周知し,より多くの研究者に使用してもらうための活動を行う.具体的には,現在ソフトウェアとして公開している本手法をサーバーとしてインターネット上で公開することである.これに関して,東北大学大学院情報科学研究科の木下賢吾先生と産業技術総合研究所の富井健太郎先生と共同でサーバー化の作業を進めている.
|
Causes of Carryover |
当初の予定では計算機を購入しようとしていたが,まだ現役で使えそうであるため,ディスプレイの購入のみにとどまり,未だ計算機を新調していないために物品費に予定との差額が生じた.差額は10万円程度であり,次年度において計算機を新たに購入しなければならない状況が生じた場合は,そのままスライドで使用する予定である.
|