2019 Fiscal Year Annual Research Report
Development of reasoning technology of open data to contribute aging studies
Project/Area Number |
18H03298
|
Research Institution | Institute of Physical and Chemical Research |
Principal Investigator |
桝屋 啓志 国立研究開発法人理化学研究所, バイオリソース研究センター, 室長 (40321814)
|
Co-Investigator(Kenkyū-buntansha) |
古崎 晃司 大阪電気通信大学, 情報通信工学部, 教授 (00362624)
小林 紀郎 国立研究開発法人理化学研究所, 情報システム本部, ユニットリーダー (20415160)
山田 一作 (小山内一作) 公益財団法人野口研究所, 研究部, 研究員 (50370185)
|
Project Period (FY) |
2018-04-01 – 2021-03-31
|
Keywords | オントロジー / 推論 / 老化 / LOD / 化合物 |
Outline of Annual Research Achievements |
探索対象データの整備:1年目の成果に基づき、ヒト、マウス、ラットのタンパク、遺伝子名のデータの整備を行った。 推論検索機能の拡張:1年目の成果に基づき、直接的関係層と間接的処理層を用いた推論検索機能について以下の4つの目的で拡張を行った。1)約2000万件の生命科学系の論文セットに対してキーワード検索し、ヒットした文献数を得る。2)RDF 形式で記述されたデータセットに対して、1の機能を使ってデータと論文との関連づけを文献数に基づいた統計的手法により行う。3) 1と2の機能を組み合わせ、2つのデータセットについてデータ同士の関連付けを文献数に基づいた統計的手法により行う。4) 複数のデータセットを Aging Miner に組み込んだ時、1, 2, 3 のそれぞれの機能を組み合わせ、 (A) 文献→データセット、(B) 文献→データセット→データセット、(C) 文献→データセット→データセットの経路でデータを検索できる様にする。これらを実現するために、データの構築は MySQL等のRDB を用いて行ない、検索システムは、Lucene等のテキスト検索エンジンと、Virtuoso等のRDFデータベースのハイブリッドとする設計を行った。RDBのテーブルは各々のステップで統合された静的なテーブルを使う。テキスト検索エンジン+RDF の環境は1つのプロセスとして構築し、途中復帰が可能な様に各々のステップで情報を RDB に保存する。 老化オントロジーを介した関連解析の実装:老化プロセスに従って機能する遺伝子、疾患等をリストアップするとともに、Interlinking Ontology for Biological Concepts (IOBC) を用いて抽出する作業をおこなった。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
探索対象データの整備は順調に進んでいる。オントロジーの実装は若干の遅れがあるが、推論検索機能の開発は、運用に踏み込んだ設計の段階に入っており、計画以上に進んでいる。以上より全体として順調に進展している。
|
Strategy for Future Research Activity |
2年間の成果をまとめて1つのツールとするプロトタイプを作成する。検索結果の妥当性について、上記老化オントロジーの構造を反映させた多面的な評価を行う。桝屋はバイオリソースや遺伝子の、山田と金は化合物が専門であり、各専門家の観点で評価する。評価をプロトタイプに反映し、統計的な評価方法の検討を行うなどして最終的なツールとしてのチューニングを行い、最終版をWeb上へのサービスとして公開する。
|
Research Products
(8 results)