• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2014 Fiscal Year Research-status Report

ディープラーニングを用いた大規模配列データからの階層的特徴抽出

Research Project

Project/Area Number 26330328
Research InstitutionKanazawa University

Principal Investigator

佐藤 賢二  金沢大学, 電子情報学系, 教授 (10215783)

Project Period (FY) 2014-04-01 – 2017-03-31
Keywordsバイオインフォマティクス / ディープラーニング / 次世代シーケンサ
Outline of Annual Research Achievements

平成26年度はまず、ディープラーニングを用いてDNA配列やアミノ酸配列の分類と予測を行っている事例について、文献調査を行った。位置特異的スコア行列(PSSM)など、従来的な配列分類予測で使われている特徴を多数組み合わせた例がいくつか報告されているが、ディープラーニングに特化した全く新しいエンコーディング方法を提案した例は見られなかった。次に、数種類の配列分類問題に対してディープラーニングを応用し、サポートベクターマシン等の分類器との性能比較を行った。特徴として数種類の固定長部分配列頻度を用いた結果、エクソン・イントロンの境界予測問題とヒストンアセチル化の予測問題については、サポートベクターマシンと同等程度の分類精度を得ることができた。また、ディープラーニングの有力な要素技術の1つであるドロップアウトについても網羅的な調査を行い、その効果を確認した。ドロップアウトにより必ずしも精度が向上するわけではなかったが、その場合でも学習の収束速度が向上することが確認された。一方、大規模配列データへの対応としては、グラフィックプロセッサ(GPU)を使った高速化の効果を確認した。近年ではディープラーニング用ソフトウェアの多くがGPUを用いた高速化に対応しているが、実験ではトロント大学で開発されたDeepNetを用いた。固定長部分配列頻度をエンコーディングに用いた場合に中間層に現れる特徴については現在解析中だが、他にもディープラーニングに特化した新しいエンコーディング手法を開発し、精度検証を行っている。

Current Status of Research Progress
Current Status of Research Progress

3: Progress in research has been slightly delayed.

Reason

様々なディープラーニング用ソフトウェアの試用と評価に時間を取られた結果、中間層に現れる特徴とエンコーディング手法に関する研究がやや遅れている。

Strategy for Future Research Activity

配列データに対するディープラーニングの実験を効率良く進めるための計算機環境を早急に整備し、中間層に現れる特徴とエンコーディング手法に関する研究を進めるとともに、最適なパラメータセットの探索を行い、大規模配列データベースからの網羅的特徴発見を行う。

Causes of Carryover

当初計画では高性能ワークステーションを1台購入して研究を進める予定だったが、より安価な多数の計算機にGPUを搭載した計算機環境とディープラーニング用のソフトウェアを組み合わせた方が効率的に研究を進められることが分かったため、各ソフトウェアと計算機およびGPUの適合調査が必要になり、物品の購入が遅れた。

Expenditure Plan for Carryover Budget

購入する計算機の仕様が固まったため、平成27年度の早い時期に購入を行う。

URL: 

Published: 2016-05-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi