研究課題/領域番号 |
17500009
|
研究種目 |
基盤研究(C)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
情報学基礎
|
研究機関 | 九州大学 |
研究代表者 |
正代 隆義 九州大学, 大学院・システム情報科学研究院, 准教授 (50226304)
|
研究分担者 |
宮原 哲浩 広島市立大学, 情報科学部, 准教授 (90209932)
内田 智之 広島市立大学, 情報科学部, 准教授 (70264934)
丸山 修 九州大学, 大学院・数理学研究院, 准教授 (20282519)
溝口 佳寛 九州大学, 大学院・数理学研究院, 准教授 (80209783)
|
研究期間 (年度) |
2005 – 2007
|
研究課題ステータス |
完了 (2007年度)
|
配分額 *注記 |
3,740千円 (直接経費: 3,500千円、間接経費: 240千円)
2007年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2006年度: 1,200千円 (直接経費: 1,200千円)
2005年度: 1,500千円 (直接経費: 1,500千円)
|
キーワード | グラフの学習 / 計算論的学習 / 帰納推論 / グラフパターン / グラフ文法 / 木構造データ / グラフ構造データ / グラフアルゴリズム |
研究概要 |
本課題では、グラフ言語の多項式時間学習アルゴリズムとその応用に関する研究を行い、我々は、実世界のグラフ構造データを表現可能ないくつかのグラフパターンを提案し、それらに対する学習アルゴリズムの設計と知識発見システムの開発を行った。主な結果は次のとおりである。 1.ウェブデータを木構造データとみなしたとき、その木の高さはほとんどの場合小さい。そこで、高さ制約代入を用いた木構造パターンの多項式時間照合・発見アルゴリズムを提案し、学習モデルとして正データからの多項式時間帰納推論および質問学習を用いて、現実的に意味のある代入制約の下で提案した木構造パターンのクラスが多項式時間学習可能であることを証明した。 2.区間グラフとは、各頂点が数直線上の互いに異なる区間に対応し、2つの区間が重なっているとき、対応する2つの頂点は辺で結ばれる、というような性質を持つグラフである。我々は、区間グラフに共通するパターンを表現する方法として、単体頂点を変数として持つ区間グラフパターンを定義し、この区間グラフパターン言語のクラスが正データから多項式時間帰納推論可能であることを示した。 3.化学化合物のほとんどが、グラフ理論的には外平面的グラフである。そこで、化学化合物データベースからのデータマイニングを行うために、ブロック保存型外平面的グラフパターン(BPOグラフパターン)を定義し、BPOグラフパターンの多項式時間照合アルゴリズムと頻出グラフパターン発見アルゴリズムを提案した。さらに、そのアルゴリズムを用いてデータマイニングシステムを作成し、計算機実験によってその有効性を確認した。 以上が、本研究課題で得た研究成果の概略である。
|