1997 Fiscal Year Annual Research Report
二分決定グラフを知識表現に用いたデータマイニングシステムの開発
Project/Area Number |
09558032
|
Research Institution | The University of Tokyo |
Principal Investigator |
宮野 悟 東京大学, 医科学研究所, 教授 (50128104)
|
Co-Investigator(Kenkyū-buntansha) |
内田 智之 広島市立大学, 情報科学部, 助教授 (70264934)
正代 隆義 九州大学, システム情報科学研究科, 助教授 (50226304)
篠原 歩 九州大学, システム情報科学研究科, 助教授 (00226151)
丸山 修 東京大学, 医科学研究所, 助手 (20282519)
阿久津 達也 東京大学, 医科学研究所, 助教授 (90261859)
|
Keywords | 二分決定グラフ / 学習 / 知識発見 / パターンマッチングアルゴリズム / データマインイング / 計算量 / 情報量 / ゲノム情報 |
Research Abstract |
知識発見のシステムを科学データに適用し,科学的発見を支援するシステムを開発することが本研究の目的である.このため,本年度は以下のような実績を挙げている. (1)二分決定グラフを用いた知識表現の定式化と知識発見方式の開発属性付きデータから,そこに潜む知識を抽出するための知識表現として二分決定グラフを用い,情報量に基づいた方法と決定木簡約化アルゴリズムにより配列データから二分決定グラフを構成するシステムのプロトタイプを作成し,計算機実験と計算量の解析により問題点を洗い出した.その結果,当初計画していた二分決定グラフの組をマインすることは現実的でないことが判明した.そのため,システム設計を,逐次サーチに基づくデータの検索と,そのデータを説明するための仮説の発見システムという形に変更している.そのため,九州大学で開発した逐次サーチに基づくテキストデータベース管理システムSIGMAを検索エンジンに用い,知識発見に適したユーザインタフェースの一部を開発している. (2)複合パターンに対する効率のよい照合アルゴリズムの開発:プロトタイプシステムでは,配列のミスマッチを許したパターン照合アルゴリズムを用いているが,より多様なパターン照合に対応するために,構造をもった文字列や蛋白質モチーフパターンに対応できる高速なアルゴリズムを開発した. (3)線形計画方の応用:アミノ酸配列データに対して,線形計画法によりコンタクトポテンシャルを発見する方式を開発し,それを蛋白質のスレディングヘ応用した. (4)二分決定グラフのドロ-イングシステムの開発:JAVA用いた二分決定グラフの描画システムのプロトタイプを作成した.
|
-
[Publications] 宮野悟,篠原歩: "コンピュータの推論による知識発見の支援" 蛋白質核酸酵素. 42. 3008-3013 (1997)
-
[Publications] O.Maruyama, H.Seki, T.Uchida, T.Shoudai, S.Miyano: "On the hardness of data mining for binary decision diagram rules" 応用数学合同研究集会報告集. 45-50 (1997)
-
[Publications] O.Maruyama, H.Seke, T.Uchida, T.Shoudai, S.Miyano: "Hypothesis creator for complete genome" Genome Informatics 1997,Universal Academy Press. 304-305 (1997)
-
[Publications] T.Akutsu, H.Tashimo: "Linear Programming based approach to the derivation of a contact potential for protein threading" Proc.3rd Pacific Symposium on Biocomputing,World Scientific. 413-424 (1998)
-
[Publications] S.Matsumoto, A.Shinohara: "Learning pattern languages using queries" Proc.3rd European Conf.Comput.Learning(LNAI1208). 185-197 (1997)
-
[Publications] M.Miyazaki, A.Shinohara, M.Takeda: "An improved pattern matching algorithm for strings in terms of straight-line programs" Proc.8th Ann.Symp.Combinatorial Pattern Matching(LNCS1264). 1-11 (1997)