Project/Area Number |
22K05924
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 41040:Agricultural environmental engineering and agricultural information engineering-related
|
Research Institution | Kazusa DNA Research Institute |
Principal Investigator |
市原 寿子 公益財団法人かずさDNA研究所, 先端研究開発部, 特任研究員 (50362398)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥2,340,000 (Direct Cost: ¥1,800,000、Indirect Cost: ¥540,000)
Fiscal Year 2024: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2023: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2022: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
|
Keywords | 表現型 / 生育環境 / 系統 / 作物 / データベース / 植物 / セマンティクス / セマンティックウェブ |
Outline of Research at the Start |
本研究では、「系統」と「表現型」、さらに、その表現型を示す条件となる「生育環境」もセットになっている情報を文献などから抽出して、セマンティックウェブ技術を用いてデータベースを構築する。その結果、例えば、特定の環境下において、特定の表現型を示す系統の共通性や系譜の抽出などを含む高度な検索システムが構築される。また、「系統」と「生育環境」と「表現型」の関係をもとに、既存系統の生育環境制御による表現型デザインの足掛かりとしての利用も念頭に置いたシステムを構築する。
|
Outline of Annual Research Achievements |
本年度は、人工的な生育環境下での検証報告数が突出しているレタス Lactuca sativaを中心に、文献からデータの収集と整理を実施し、データベースを構築した。特に、レタスについては、453報の文献から約16,000件のデータを抽出・整理した。親情報などの由来が記述された系統テーブル、植物体の各部位の長さや重量、代謝産物の産生量などの測定項目が記述された形質テーブル、試験名称や実施年度などが記述された試験テーブル、光源や温度などの検証される条件の種類や名称が記述された条件テーブル、測定値を記述するための測定値テーブルを定義し、データを格納した。その結果、例えば着目する系統について、特定の条件下における表現形質の情報を検索して一括で取得できるようになった。ウェブページを介してデータベースにアクセスするためのウェブインターフェースは、PHPベースのシステムを使って構築を開始した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
初年度、データ収集の方法として、論文のアブストラクトに対してテキストマイニングツールを用いて植物種名、系統名、生育環境、表現型情報の抽出を試みていたのに対し、本年度は、情報収集の対象の中心を文献中のテーブルに変更した。その結果、データ収集の精度と効率が向上した。データを格納するシステムについては、リソース間の関係を表現するグラフ形式のデータモデルである RDF (Resource Description Framework) と、テーブル間の関係を表現する表形式のデータモデルであるRDB (Relational Database) の両方を同時に扱える Virtuoso (https://virtuoso.openlinksw.com/) で構築した。
|
Strategy for Future Research Activity |
ウェブページを介してデータベースへアクセスするためのインターフェースは、現在、PHPベースのシステムで構築中であり、これが完成し次第、レタスのデータのみで先行してシステムを公開する。レタスの他にシソ(Perilla frutescens)などの香味作物も、人工的な生育環境下での検証報告が多くあるので、これらについても順次公開する。 本課題で構築している[植物の系統・生育環境・表現型]のデータベースは、将来的には、遺伝的なバックグラウンド情報と組み合わせて使用し、企図する表現形質を発現しやすい系統候補と生育環境の組み合わせ等を提示する「既存系統の表現型デザイン」システムの基盤として使用する計画である。このため、対象とする植物は、ゲノム解読されていることが望ましい。従って、データの整備と公開の優先度を決定するための重要な指標として、データの充実度に加えて、ゲノム配列の公開状況も考慮する。例えば、シソも、近年高精度のゲノム配列が公開されており、この条件に合致する。
|