研究概要 |
本研究課題では構造的データに潜む知識を効果的に発見するためのデータマイニングと機械学習について研究を行った.本研究の目的は,非均質で構造化された大規模なデータに潜む多様な知識の発見に焦点を当てて,必要とされる構造的知識を発見するためのデータマイニングと機械学習における新しい基盤技術を開発することである.本年度は構造的データとしてグラフ構造データおよび木構造データを対象にした機械学習に重点をおき,次の成果を得た. グラフ構造データからの機械学習やデータマイニングの研究が注目されている.TTSPグラフ(Two-Terminal Series Parallel graph)は,電気ネットワークやスケジューリングをコンピュータで扱う際にデータモデルとして用いられることが多い.TTSPグラフは並列操作,直列操作と呼ばれる操作を帰納的に繰り返して得られるサイクルを持たない多重辺を許す有向グラフである.正事例と負事例からなるTTSPグラフの集合から,多くの正事例にマッチし,負事例にあまりマッチしないような,特徴的なTTSPグラフパターンを獲得する進化的手法を提案した.進化的手法としてTTSPグラフパターンの構文木に対して遺伝的プログラミングを適用し,遺伝操作は複製,逆位,交叉,突然変異を用いた.人工的に生成したTTSPグラフに対して実験を行い,提案する特徴的なTTSPグラフパターンを獲得する進化的手法の有効性を確認した.また,正事例から補可約グラフパターン言語を効率的に学習するアルゴリズムと木構造データに対する新たなカーネル法を提案した.
|