研究課題/領域番号 |
18H03298
|
研究機関 | 国立研究開発法人理化学研究所 |
研究代表者 |
桝屋 啓志 国立研究開発法人理化学研究所, バイオリソース研究センター, ユニットリーダー (40321814)
|
研究分担者 |
古崎 晃司 大阪大学, 産業科学研究所, 准教授 (00362624)
小林 紀郎 国立研究開発法人理化学研究所, 情報システム本部, 上級研究員 (20415160)
山田 一作 (小山内一作) 公益財団法人野口研究所, 研究部, 研究員 (50370185)
|
研究期間 (年度) |
2018-04-01 – 2021-03-31
|
キーワード | オントロジー / 推論 / 老化 / LOD |
研究実績の概要 |
探索対象データの整備:探索対象として本システムに含めるデータ(LOD)を、生命科学データベースであるNBDC RDF PortalのデータやIntegbioデータベースカタログ、BioSharing.orgなどを対象に選別を行った。その結果、化学物質の網羅的オントロジーであるCHEBI、生命科学キーワードの語彙集であるMESH、ヒト遺伝子のリストであるHGNCを利用することを決定した。 推論アルゴリズムの開発: 小林らが先行研究において開発した推論システムPosMedのアルゴリズムを改良することで、LODとテキストマイニング由来データを融合した推論検索機能を実現することを目的として、文献共起データに基づき、キーワードと、キーワードを含むデータ(事象)との関係性を統計的に処理し(直接的関係層)、さらにデータ同士の関係を処理する(間接的処理層)をサーバー1台で実用速度で動作できるように軽量化を行なった。 これを用いて予備的な検証を行った。二次代謝産物データベースの49,983件の化合物リストと、Medline2018最新版の2,456万件の文献データを用いて、老化キーワードと、直接ではなく、遺伝子や疾患を介して間接的に関連するデータを抽出し、関連度によりランキングした。それにより抽出された上位10個の化合物についてPubmedを調査したところ、老化と直接の関連性は見つからず、新規老化関連化合物の候補となる可能性が示唆された。また、操作に関するGUIの整理を行い、様々な要素の関連ををわかりやすく提示できるようにした。 老化オントロジー作成:老化現象を構成する多様な事象を、is-a (分類/継承)及び part-of (部分)の各関係性で整理し体系的にまとめたオントロジーを作成ことを目的として、その基本構造の検討を行った。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
探索対象データの整備に関しては、CHEBI、MESH、HGNCの探索を行うなど順調に進行している。 推論アルゴリズムの開発に関しては、予備的な解析でポジティブな結果が出たことなど、計画以上の進展があった。 一方老化オントロジーの開発に関しては、基本構造の検討を行うことができたが、この構造化された検索キーワードとしてPosMed検索に応用する方法論の開発が必要であることが可能となった。 全体として順調に進展している。
|
今後の研究の推進方策 |
探索対象データの整備は、前年度の成果を基盤として、 RDF形式に変換や、常に最新のデータを扱えるように、データ更新のワークフローの確立を行う。 推論アルゴリズムの開発は、1年目に開発した推論アルゴリズムを、直接的関係層と間接的関係層に分けて検索結果を並 列して示せるように機能改変する。これを擬似的に既知と未知の知見とし、それぞれの統計 的評価方法を確立する。 廊下オントロジーに関しては、構造化された検索キーワードとしてPosMed検索に応用し、老化 現象の多面性、複合性を検索結果に反映できるようにする。
|