セマンティックウェブ技術を用いた植物の系統・生育環境・表現型のデータベース
Project/Area Number |
22K05924
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 41040:Agricultural environmental engineering and agricultural information engineering-related
|
Research Institution | Kazusa DNA Research Institute |
Principal Investigator |
市原 寿子 公益財団法人かずさDNA研究所, 先端研究開発部, 特任研究員 (50362398)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2022)
|
Budget Amount *help |
¥2,340,000 (Direct Cost: ¥1,800,000、Indirect Cost: ¥540,000)
Fiscal Year 2024: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2023: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2022: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
|
Keywords | データベース / 植物 / 系統 / 生育環境 / 表現型 / セマンティクス / セマンティックウェブ |
Outline of Research at the Start |
本研究では、「系統」と「表現型」、さらに、その表現型を示す条件となる「生育環境」もセットになっている情報を文献などから抽出して、セマンティックウェブ技術を用いてデータベースを構築する。その結果、例えば、特定の環境下において、特定の表現型を示す系統の共通性や系譜の抽出などを含む高度な検索システムが構築される。また、「系統」と「生育環境」と「表現型」の関係をもとに、既存系統の生育環境制御による表現型デザインの足掛かりとしての利用も念頭に置いたシステムを構築する。
|
Outline of Annual Research Achievements |
植物の表現型は、遺伝子型と環境、さらにその両者の組み合わせの相乗効果の影響を受けやすいことが知られており、同じ遺伝子型でも異なる環境においては異なる表現型を示すことがある。この性質をうまく利用できると、既存の系統の生育環境を制御することによって、交配育種に依らずに、意図した表現型を示す作物を生育させる「既存系統の表現型デザイン」が可能となる。交配育種では、結果として得られる次世代を選抜する過程が生じるが、本方法では、当代での選抜が可能であり、結果として育種の高速化が期待できる。近年、複数の系統を複数の環境条件下で栽培し、表現型として現れる系統の特性を評価する報告が多数ある。特に、生育環境が厳密に制御される植物工場を含む施設園芸のデータでは、複数の系統について、複数の温度、湿度、光量、養液などの環境下で観察される形態や代謝産物の違いが表現型情報として含まれる。従って、これらの情報は、生育環境の制御による既存系統の表現型デザインの足掛かりとして活用できると考えられる。しかし、公開されているデータは文献上にとどまっているものが多く、再利用されにくい状態である。 本研究は、文献から系統や生育環境、表現型の情報を抽出してデータベース(以下、DB)化し、交配育種に依らない既存系統の表現型デザインの足掛かりとなるシステムの構築を目的とする。系統、生育環境、表現型の情報をDB化するにあたって、従来からよく使われている関係データベース(Relational DB、以下RDB)と、セマンティックウェブ技術において標準的な形式の一つであるリソースディスクリプションフレームワークを利用したグラフDBを併用して構築している。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
植物種名や植物工場で条件検討されることが多い情報の単語やフレーズ(CO2等)を用いて、PubMed(https://pubmed.ncbi.nlm.nih.gov/)を中心に文献検索を実施し、約750件の文献を収集した。次に、PubTator (https://www.ncbi.nlm.nih.gov/research/pubtator/, PubMedのテキストマイニングツール) をはじめとしたツールを利用して、植物種名、系統名、生育環境、表現型の情報を抽出を試みた。自作スクリプトとの組み合わせで効率と精度の向上を図っているが、場合によっては情報の取りこぼしなどが見られた。
|
Strategy for Future Research Activity |
文献からの情報抽出での取りこぼしについては、使用ツールの最適な条件設定の検証とともに、使用するツールの変更も検討中である。抽出時の条件と結果の情報を蓄積しているので、これらの傾向の解析も行い活用する。 データを格納するためのシステムは、既存のマシンで試験的に構築し、動作を検証している。R5年度もこの方針で進める。
|
Report
(1 results)
Research Products
(1 results)
-
[Journal Article] Plant GARDEN: a portal website for accessing plant genome, DNA marker, and SNP information2022
Author(s)
H. Ichihara, H. Hirakawa, A. Ghelfi, M. Kohara, M. Yamada, T. Tamura, A. Nakaya, Y. Nakamura, S. Shirasawa, E. Sugihara, S. Tabata, S. Isobe
-
Journal Title
Acta Hortic
Volume: 1339
Issue: 1339
Pages: 415-418
DOI
Related Report