研究課題/領域番号 |
26330328
|
研究機関 | 金沢大学 |
研究代表者 |
佐藤 賢二 金沢大学, 電子情報学系, 教授 (10215783)
|
研究期間 (年度) |
2014-04-01 – 2017-03-31
|
キーワード | バイオインフォマティクス / ディープラーニング / 次世代シーケンサ |
研究実績の概要 |
平成26年度はまず、ディープラーニングを用いてDNA配列やアミノ酸配列の分類と予測を行っている事例について、文献調査を行った。位置特異的スコア行列(PSSM)など、従来的な配列分類予測で使われている特徴を多数組み合わせた例がいくつか報告されているが、ディープラーニングに特化した全く新しいエンコーディング方法を提案した例は見られなかった。次に、数種類の配列分類問題に対してディープラーニングを応用し、サポートベクターマシン等の分類器との性能比較を行った。特徴として数種類の固定長部分配列頻度を用いた結果、エクソン・イントロンの境界予測問題とヒストンアセチル化の予測問題については、サポートベクターマシンと同等程度の分類精度を得ることができた。また、ディープラーニングの有力な要素技術の1つであるドロップアウトについても網羅的な調査を行い、その効果を確認した。ドロップアウトにより必ずしも精度が向上するわけではなかったが、その場合でも学習の収束速度が向上することが確認された。一方、大規模配列データへの対応としては、グラフィックプロセッサ(GPU)を使った高速化の効果を確認した。近年ではディープラーニング用ソフトウェアの多くがGPUを用いた高速化に対応しているが、実験ではトロント大学で開発されたDeepNetを用いた。固定長部分配列頻度をエンコーディングに用いた場合に中間層に現れる特徴については現在解析中だが、他にもディープラーニングに特化した新しいエンコーディング手法を開発し、精度検証を行っている。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
様々なディープラーニング用ソフトウェアの試用と評価に時間を取られた結果、中間層に現れる特徴とエンコーディング手法に関する研究がやや遅れている。
|
今後の研究の推進方策 |
配列データに対するディープラーニングの実験を効率良く進めるための計算機環境を早急に整備し、中間層に現れる特徴とエンコーディング手法に関する研究を進めるとともに、最適なパラメータセットの探索を行い、大規模配列データベースからの網羅的特徴発見を行う。
|
次年度使用額が生じた理由 |
当初計画では高性能ワークステーションを1台購入して研究を進める予定だったが、より安価な多数の計算機にGPUを搭載した計算機環境とディープラーニング用のソフトウェアを組み合わせた方が効率的に研究を進められることが分かったため、各ソフトウェアと計算機およびGPUの適合調査が必要になり、物品の購入が遅れた。
|
次年度使用額の使用計画 |
購入する計算機の仕様が固まったため、平成27年度の早い時期に購入を行う。
|