2007 Fiscal Year Annual Research Report
階層的構造データからの特徴的パタン発見に関する研究
Project/Area Number |
19700146
|
Research Institution | Kobe University |
Principal Investigator |
尾崎 知伸 Kobe University, 自然科学系先端融合研究環重点研究部, 助教 (40365458)
|
Keywords | データマイニング / 半構造データマイニング / グラフマイニング / 飽和パタン発見 / 階層的構造データ |
Research Abstract |
木構造データベースからの特徴的パタン発見手法として,(1)制約付き頻出飽和パタン発見手法の開発,(2)ノイズを考慮した頻出極小パタン発見手法の開発を行った.また,これらの研究成果を活かし,階層的構造データの一種である,(3)複合構造グラフからの制約付き頻出飽和パタン発見手法の開発を行った. (1)木構造DBを対象とした飽和パタン発見アルゴリズムを基に,節点数や高さなどパタンとして抽出すべき形状に関ずる制約を与えた上での飽和パタン発見手法を開発した.利用者の意図を表す制約を導入することにより,利用者にとろて興味深いパタンのより効率的な発見の支援が期待される.また,提案手法における基本アイディアは,多くの制約付き構造データマイニングに応用可能であるを考えている. (2)木構造DBを対象に,頻出パタン集合の圧縮表現として,δ-Freeパタンと呼ばれるノイズを考慮した極小パタンの発見アルゴリズムの開発を行った.δ-Freeパタンは,アイテム集合におけるそれの素直な拡張であり,DBのコンパクトな表現であると同時に,分類ルールを獲得する際のビルデングブロックとしての利用も期待ざれる. (3)代表的な階層的構造データとして,複合構造グラブ(複数め構造データからなる頂点を持つグラフデータ)を対象とした特徴的パタン発見手法の開発を行った.まず,頂点構造とグラフ構造を同時に列る基本手法を設計し,この基本手法に,発見べきパタンの形状に関する制約を導入することで,代表的・特徴的なパタシのみを高速に列挙するアルゴリズムを開発した.さらに開発したアルゴリズムを生物の代謝経路データに適用し,代謝に関わる化合物や酵素に関する情報(アミノ酸配列,酵素番号など)を頂点に含む複合的なパタンの発見に成功した.
|