本研究では、育種研究者が着目する系統や形質の情報に基づいて交配や解析に適する遺伝素材の組み合わせ候補を偏りなく抽出、提示するシステムをセマンティックウェブ技術によって構築することを目指した。セマンティックウェブ技術は、ウェブ上に存在する情報の意味をコンピュータが識別できるように整備することで、情報の抽出や判別、分析作業の自動化を可能にするものである。共通する識別子を介して情報が連結される性質を利用し、公開されている遺伝素材の系統間の親子関係を介して系譜情報を構築する。この系譜情報は、それぞれの遺伝素材が保有する形質情報とも紐づいており、系統や形質についての多元的な比較や情報の抽出を可能にする。 本研究は、データ構造がネットワーク状のグラフ型データベースを採用することで、自動的な系譜情報の生成や整理の実施、検索の効率化を肝としているが、検索の対象や条件によっては、データ構造がリレーショナル状であるリレーショナルデータベースでの検索の方が効率的であると考えられた。このことから、リレーショナルデータベースを併用することとし、システムに導入した。グラフ型データベースとしては、Virtuoso(https://virtuoso.openlinksw.com/)を、リレーショナルデータベースとしては、MariaDB(https://mariadb.com/kb/en/)を実装した。リンゴなどの生産量・生産額が多い政令指定作物の13品目をはじめ、150品目に対してデータの整理を実施し、格納した。
|