研究課題/領域番号 |
17500009
|
研究種目 |
基盤研究(C)
|
研究機関 | 九州大学 |
研究代表者 |
正代 隆義 九州大学, 大学院・システム情報科学研究院, 助教授 (50226304)
|
研究分担者 |
丸山 修 九州大学, 大学院・数理学研究院, 助教授 (20282519)
宮原 哲浩 広島市立大学, 情報科学部, 助教授 (90209932)
内田 智之 広島市立大学, 情報科学部, 助教授 (70264934)
|
キーワード | グラフの学習 / 計算論的学習 / 帰納推論 / グラフパターン / グラフ文法 / 木構造データ / グラフ構造データ / グラフアルゴリズム |
研究概要 |
本課題では、グラフ言語の多項式時間学習アルゴリズムとその応用に関する研究を行い、平成17年度は次の結果を得た。 申請者等は、平成16年度までに、木構造データの共通パターンを表現する柔軟性に富む木構造パターンとそのクラスを定義し、そのクラスに対する帰納学習あるいは例からの概念学習とよばれる基礎的研究を行った。これにより得られた一連の研究成果は、HTMLやXMLデータのような木構造データからの知識発見にはたいへん有効であった。一方、ウェブグラフや地図情報、表といったような循環リンクを持っているデータに対する知識発見のためには、木構造パターンでは限界があり、循環リンク構造を持つグラフ構造パターンによる知識発見アルゴリズムとその学習理論の構築が必要である。そこで本年度は、木構造パターンの表現可能性を明らかにしつつ、TTSPグラフと区間グラフで表されるデータを対象とする2つのグラフパターン言語の学習可能性を考察した。具体的には以下のとおりである。 TTSPグラフとは、明確に区別された2つの頂点とそれらを結ぶ1つの辺から始めて、直列操作または並列操作を繰り返し行うことにより得られるグラフである。TTSPグラフは電気回路のモデルとして扱われる。申請者等は、TTSPグラフに基づくグラフパターンとして線形項TTSPグラフを定義し、そのグラフパターンのクラスが正データから多項式時間帰納推論可能であることを示した。 区間グラフとは、各頂点が数直線上の互いに異なる区間に対応し、2つの区間が重なっているとき、対応する2つの頂点は辺で結ばれる、というような性質を持つグラフである。申請者等は、区間グラフに共通するパターンを表現する方法として、単体頂点を変数として持つ区間グラフパターンを定義し、この区間グラフパターン言語のクラスが正データから多項式時間帰納推論可能であることを示した。 以上が、本年度に得た研究成果の概要である。
|