2019 Fiscal Year Annual Research Report
An integrated knowledgebase for the birth of new plant species
Publicly Offered Research
Project Area | Determining the principles of the birth of new plant species: molecular elucidation of the lock-and-key systems in sexual reproduction |
Project/Area Number |
19H04870
|
Research Institution | Meiji University |
Principal Investigator |
矢野 健太郎 明治大学, 農学部, 専任教授 (00446543)
|
Project Period (FY) |
2019-04-01 – 2021-03-31
|
Keywords | バイオインフォマティクス / ゲノム / トランスクリプトーム / デジタル情報解析技術 / 自然言語処理 / 知識・オミックス情報 |
Outline of Annual Research Achievements |
現在、多くのゲノムDNA配列情報やRNA-Seqデータなどの大規模オミックス情報が公開データベースに蓄積している一方で、これらのビッグデータを活用した遺伝子探索ができない。この要因として以下の3点がある。(1)公開データベースに登録されているRNA-Seqデータには、実験条件の記述フォーマットに統一性がなく、mRNAサンプルの由来(器官・ステージなど)を容易に把握できない。その結果、大規模RNA-Seqデータを取得・解析しても、サンプル(葯、開花期など)における特異的発現遺伝子群などを探索できない。(2)従来の遺伝子発現データ解析法はピアソン相関係数の算出に基づくため膨大な計算コスト(計算機メモリーや計算時間など)を要し、大型計算機でも大規模情報を解析できない。(3)バイオインフォマティクスによる遺伝子探索では候補遺伝子数が数百個以上となることが多く、遺伝子機能アノテーション情報を併用した遺伝子選抜が望まれる。しかし、アノテーション情報の大半が不明瞭な記述(Unknown Proteinなど)であり、十分に活用できない。 そこで、シロイヌナズナ、イネ、トマトなどの主要植物種を対象とし、各植物種の遺伝子発現ネットワーク(GEN)を構築し、種横断的に比較可能なシステムを構築した。RNA-Seqデータの実験条件(mRNAの由来、器官など)の把握を容易とするために、登録情報(実験条件)に対するマニュアル・キュレーションからオントロジーを付与し、網羅的なサンプル分類と比較解析を行った。そして、この大規模解析を実施可能とするための解析アルゴリズムを開発した。また、学術論文テキスト情報を収集した後に、自然言語処理とマニュアル・キュレーションを実施し、遺伝子機能に関する高信頼度知識情報を集積し、システムに統合した。これらのオミックス・知識情報はWebデータベースPODCから公開するに至っている。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
オミックス解析については、年度内に予定していた解析を終了し、新たな網羅的オミックス情報解析に着手している。知識情報の蓄積についても解析ステップの効率化により予定よりも早く進展しており、解析終了分より順次データベースより公開している。 また、蓄積したオミックス情報、特に、オントロジーや種間オーソログ、遺伝子発現制御機構、遺伝子発現プロファイルに関する大規模情報、そして、遺伝子機能の知識情報に基づき、多面的な遺伝子探索と網羅的な種間比較解析を展開し、生殖関連遺伝子候補を探索した。その結果、ウエット実証実験に資する遺伝子候補の選抜に成功した。
|
Strategy for Future Research Activity |
植物の新種誕生の原理の解明促進を目的として、モデル農作物・植物についての種横断的な遺伝子発現ネットワーク比較解析および高精度機能アノテーション情報解析を進め、得られた結果をWebデータベースPODCに格納し、研究者コミュニティーや社会に発信する。特に、文献情報を用い、自然言語処理により生物学的機能に関する知識情報を集約し、マニュアル・キュレーションを通して高精度・高信頼度な機能アノテーション情報を遺伝子(産物)に付与する。高速シーケンサー・データより構築した遺伝子発現ネットワーク情報と遺伝子発現制御情報を融合すると共に、たとえば、生殖機能などに関わる遺伝子群の植物種間での共有性・特異性を簡便に抽出可能とする。
|
Research Products
(27 results)
-
[Journal Article] Evolution and diversity of the wild rice Oryza officinalis complex, across continents genome types, and ploidy levels2020
Author(s)
Matt Shenton, Masaaki Kobayashi, Shin Terashima, Hajime Ohyanagi, Dario Copetti, Tania Hernandez-Hernandez, Jianwei Zhang, Nobuko Ohmido, Masahiro Fujita, Atsushi Toyoda, Hiroshi Ikawa, Asao Fujiyama, Hiroyasu Furuumi, Toshie Miyabayashi, Takahiko Kubo, David Kudrna, Rod Wing, Kentaro Yano, Ken-ichi Nonomura et al.
-
Journal Title
Genome Biology and Evolution
Volume: 12
Pages: 413~428
DOI
Peer Reviewed / Open Access / Int'l Joint Research
-
-
-
-
-
-
[Presentation] Plant Omics Databases: Plant Omics Data Center (PODC), CATchUP and TOMATOMICS2020
Author(s)
Toshiharu Endo, Misa Saito, Maasa Kanno, Shizuka Koshimizu, Kong Bihe, Shun Ohki, Eiji Nambara, Hajime Ohyanagi, Koh Aoki, Hiroshi Ezura, Kentaro Yano
Organizer
International Plant & Animal Genome XXVIII
Int'l Joint Research
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-