研究概要 |
疾病や生物プロセスなど,生命現象のメカニズムを対象とした知識処理では,論文やデータベースのコメント欄に自然言語で記述された知識の電子化手法が従来の課題であった。そのため遺伝子機能を記述するためのオントロジーや,論文から該当知識を抽出するテキストマイニングなどの自然言語処理技術の研究開発が世界的に進められてきた。また,生命現象の分子メカニズムを記述するパスウェイデータベースについては,オントロジーで詳細に意味を定義したデータフォーマットを標準化させようという国際的な取り組みがすすんでいる。これらの成果により,近い将来,専門家によってキュレートされた知識自然言語処理システムが自動抽出した知識,そして様々な実験技術から導出された知識というように精度も性質も異なる情報が共通のプラットホーム上で入手可能になる事が期待される。このような状況を見据えて,今後は互いに整合性を持っていると保障されていない異なる出自のデータを対象とした知識処理技術の開発が必要となる。そこで本研究ではパスウェイデータの矛盾検出に関する知識表現の基礎研究を展開し,本年度は主として以下の成果を得ることができた。1)イベント知識ベース構築の為の形式オントロジーの開発。2)BioPAX オントロジーで記述されたデータをバックエンドデータベースに格納する為の検索ライブラリpaxtoolsの開発。3)INOHデータのBioPAXフォーマットでのリリース。1)はイベント表現を蓄積する知識ベースの基盤となる上位オントロジーである。パスウェイは様々な要素が多様な関係性をもちながら細胞機能という現象を引き起こす分子メカニズムであるが,この現象の表現を一般化したものがイベントである。
|