研究概要 |
研究実績は以下のとおり. 1.共学習システムを構築する際に用いる学習アルゴリズムとして,グラフ構造データを対象とし,ラベル付きデータに対してグラフ構造に対する決定木構築アルゴリズム,ラベル無しデータに対してグラフクラスタリングアルゴリズムを検討した. 2.決定木構築アルゴリズムに対して,データに含まれる部分グラフの特徴に基づいて分類に効果的な部分構造(部分グラフ)を再帰的に抽出し,抽出した部分構造を属性として利用して決定木を構築する手法を検討した.検討した手法は分類に使用する属性をオンラインで構築するため,属性構築の一手法とみますことができる. 3. 2.で検討したアルゴリズムを計算機上にプログラムとして実装し,実データ(DNA promoterデータセット)を対象としてその基本性能(分類制度)を検証した.その結果,領域知識を用いて構築した分類器と同等の分類制度を持つ分類器(決定木)が構築されることを確認し,事前に領域知識が得られないデータに対しても分類精度の高い分類器を構築する可能性を示唆した. 4. 3.で実装したプログラムが抽出する部分構造(部分グラフ)をラベル無しデータとみなし,部分グラフの構造的類似性に基づくグラフクラスタリング手法を検討した.グラフに含まれる部分グラフの頻度をスペクトルとして表現し,スペクトル間の類似度に基づいてグラフ間の類似度を計測してクラスタリングを行う手法を検討した.人工データを用いた評価実験を通じ,グラフの頂点数や辺数に関して有効であることを確認したが,形状の類似性に対して課題が残ることも確認した.
|