2016 Fiscal Year Research-status Report
ディープラーニングを用いた大規模配列データからの階層的特徴抽出
Project/Area Number |
26330328
|
Research Institution | Kanazawa University |
Principal Investigator |
佐藤 賢二 金沢大学, 電子情報学系, 教授 (10215783)
|
Project Period (FY) |
2014-04-01 – 2018-03-31
|
Keywords | テキスト分類 / 畳み込みニューラルネットワーク / スプライス部位 / プロモータ / 単語埋め込み / 次世代シーケンサ / ゲノム配列決定 |
Outline of Annual Research Achievements |
平成28年度は、昨年度に続いてテキスト分類のための畳み込みニューラルネットワークをDNA配列分類に応用する研究を行った。その一方で、全く新しいDNA配列に対する提案手法の特徴抽出能力を評価するために、能登地方に自生するキノコの一種を対象として、次世代シーケンサによる配列決定を行った。対象生物の発生時期である10月以降にサンプル採取を行い、予備調査として、2種類の株について長さ100塩基程度のショートリードを読み取り、ゲノム配列の構築を試みた。リード長が短いことから、多くのゲノム領域で欠損が見られたが、不完全ながらも数千個の遺伝子を同定することができた。また、同様のショートリードが公開されている近縁種のキノコと比較を行った。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
サンプル採取が10月しか行えないことと、次世代シーケンサによる配列決定に時間がかかったため、本調査であるロングリードの配列決定およびRNA Seqによる遺伝子領域決定を年度内に行うことができなかった。
|
Strategy for Future Research Activity |
平成29年度は、次世代シーケンサによる配列決定を完了し、構築したゲノム配列を対象として深層学習を行うことで、今まで見つからなかった新しい配列特徴の発見を目指す。
|
Causes of Carryover |
平成28年度に予定していた「微生物ゲノム配列の新規決定と解析」について、対象生物として能登地方固有の菌類を選定した結果、10月のシーズンまでサンプル採取が遅れた。これに加えて、精密な配列決定のためにショートリードとロングリードの2段階の配列決定が必要になり、当初予想より時間を要し、最終的な納品が平成29年度にかかることが判明した。
|
Expenditure Plan for Carryover Budget |
ロングリードの配列決定結果が4月末に納品され、予算の大部分を使用し終えた。
|
Research Products
(1 results)
-
[Journal Article] DNA Sequence Classification by Convolutional Neural Network2016
Author(s)
Nguyen,N.G., Tran,V.A., Ngo,D.L., Phan,D., Lumbanraja,F.R., Faisal,M.R., Abapihi,B., Kubo,M., Satou,K.
-
Journal Title
Journal of Biomedical Science and Engineering
Volume: 9
Pages: 280-286
DOI
Peer Reviewed / Open Access / Acknowledgement Compliant