疾病や生物プロセスなど、生命現象のメカニズムを対象とした知識処理では、論文やデータベースのコメント欄に自然言語で記述された知識の電子化手法が従来の課題であった。そのため、遺伝子機能を記述するためのオントロジーや、論文から該当知識を抽出するテキストマイニングなどの自然言語処理技術の研究開発が世界的に進められてきた。また、生命現象の分子メカニズムを記述するパスウェイデータベースについては、オントロジーで詳細に意味を定義したデータフォーマットを標準化させようという国際的な取り組みがすすんでいる。これらの成果により、近い将来、専門家によってキュレートされた知識、自然言語処理システムが自動抽出した知識、そして様々な実験技術から導出された知識、というように精度も性質も異なる情報が共通のプラットフォーム上で入手可能になることが期待される。このような状況を見据えて、今後は互いに整合性を持っていると保証されていない異なる出自のデータを対象とした知識処理技術の開発が必要となる。特に複雑な情報構造を持つパスウェイデータベースについては、様々なレベルで矛盾・不整合を含むパスウェイの知識処理が望まれる。しかしながら、パスウェイ知識の矛盾検出については、知識表現の理論的な解析を含む基礎研究がほとんどなされていない。 本研究では複数オントロジー存在下での推論、パスウェイデータベースを用いた知識統合、新規知識の導出を目標として、パスウェイデータの矛盾検出に関する知識表現の基礎研究を展開する。平成18年度は主として以下の成果を得ることができた。1)OWLオントロジー記述言語による高度なパスウェイ知識表現法の設計開発。2)BioPAXオントロジーでは表現できないパスウェイ知識の表現手法の開発。3)INOHデータのBioPAXフォーマットでのリリース。4)パスウェイデータの満たすべき整合性ルール、矛盾検出ルールの整備/開発(継続中)。
|