2001 Fiscal Year Annual Research Report
Project/Area Number |
12680373
|
Research Institution | Japan Advanced Institute of Science and Technology |
Principal Investigator |
佐藤 賢二 北陸先端科学技術大学院大学, 知識科学研究科, 助教授 (10215783)
|
Keywords | ゲノムデータベース / サーチエンジン / データマイニング / 相関ルール発見 / 専門用語 / オントロジー |
Research Abstract |
昨年度は、ゲノムデータベースの全文検索システムSTAGに、相関ルール発見手法を用いたデータマイニング機能を組み込むことにより、ユーザが着目している検索結果集合に共通かつ特有なリンク情報を提示するシステムを実現した。このシステムでは、ゲノムデータベースに含まれる膨大なリンク情報を全て使うのではなく、着目しているエントリ集合に関係するものだけを高速に切り出し、マイニングを行うことにより、Webでサービスしても十分な応答速度で知識発見を行うことができた。また、高精度な類似文書検索を実現するために、ゲノムデータベースから専門用語と思われるものを大量に切り出し、一種のオントロジーを構築した。 本年度は、以下の研究を行った。 ・前年度に構築したオントロジーを知識発見システムに組み込み、リンク情報と言語情報を統合した知識発見システムを構築した。これにより、2種類の異なる情報を比較検討しながら、着目するエントリ集合に関する知識発見を行うことが可能になった。 ・マイニングの結果を単にリスト表示するのではなく、二次元の表の形で表示することにより、ユーザが着目するエントリ集合の意味を把握しやすくした。具体的には、マイニングの結果として得られるルールの重要度に従って各アイテム(リンク情報や言語情報)とエントリ集合をソートすることにより、着目するエントリ集合がいくつかのグループやサブグループに分かれることを視覚的に表現した。 以上の研究により、数千万の文書から成るヘテロジニアスなゲノムデータベースを対象として、全文検索技術と知識発見技術を統合した実用的なシステム構築を行い、その有用性を確認することができた。今後はさらなる規模の拡大と、ホモロジー検索やパスウェイ検索などゲノムデータベース特有の検索処理との連携を目指す。
|
Research Products
(1 results)