研究課題/領域番号 |
17500009
|
研究機関 | 九州大学 |
研究代表者 |
正代 隆義 九州大学, 大学院・システム情報科学研究院, 准教授 (50226304)
|
研究分担者 |
溝口 佳寛 九州大学, 大学院・数理学研究院, 准教授 (80209783)
宮原 哲浩 広島市立大学, 情報科学部, 准教授 (90209932)
内田 智之 広島市立大学, 情報科学部, 准教授 (70264934)
|
キーワード | グラフの学習 / 計算論的学習 / 帰納推論 / グラフパターン / グラフ文法 / 木構造データ / グラフ構造データ / グラフアルゴリズム |
研究概要 |
本課題では、グラフ言語の多項式時間学習アルゴリズムとその応用に関する研究を行い、平成19年度において我々は、木構造パターン、区間グラフパターン、外平面的グラフパターンなど、実世界のグラフ構造データを表現可能なグラフパターンを提案し、それらに対する学習アルゴリズムの設計と知識発見システムの開発を行った。主な結果は次のとおりである。 順序項木とは、超辺置換に基づく代入操作ができる木構造パターンで、変数にグラフの構造に基づく代入制約を持たせることができる。HTML/XMLファイルなどのウェブデータは木構造データとみなすことができ、そのようなファイルから特徴的なパターンを発見することで情報検索技術の発展が期待できる。一方で、ウェブデータは統一的な記述スタイルが存在するわけではないので、対象を限ったとしても1つのパターンで全体を表現することは難しい。そこで我々は、学習モデルとして有限和の質問学習モデルを用い、順序項木言語の有限和集合を説明する有限個の順序項木を発見する多項式時間アルゴリズムを提案した。 また、平成18年度に引き続き、化学データベースからの知識発見システムの開発を行った。我々は、化学データベースに含まれる化学化合物のほとんどが、グラフ理論的には外平面的グラフであることを考慮し、ブロック保存型外平面的グラフパターン(BPOグラフパターン)とよばれるグラフパターンを提案している。本年度は、BPOグラフパターン言語の正データからの多項式時間帰納推論アルゴリズムを提案し、このアルゴリズムを頻出グラフパターン発見システムに導入し、パターン発見のために必要な計算時間の高速化を達成した。 以上が、本年度に得た研究成果の概要である。
|