2007 Fiscal Year Annual Research Report
データマイニングと機械学習による半構造データからの情報融合
Project/Area Number |
19500129
|
Research Institution | Hiroshima City University |
Principal Investigator |
宮原 哲浩 Hiroshima City University, 情報科学研究科, 准教授 (90209932)
|
Co-Investigator(Kenkyū-buntansha) |
内田 智之 広島市立大学, 情報科学部, 准教授 (70264934)
廣渡 栄寿 北九州市立大学, 基盤教育センター, 准教授 (60274429)
久保山 哲二 東京大学, 国際・産学共同研究センター, 助教 (80302660)
|
Keywords | データマイニング / 機械学習 / 木構造データ / 遺伝的プログラミング |
Research Abstract |
本研究課題ではデータマイニングと機械学習による半構造データからの情報融合について研究を行い、本年度は次の成果を得た.本研究の目的は、アルゴリズム理論的観点から研究を展開し、データマイニングと機械学習技術を活用して、大規模な半構造データからの情報抽出と情報融合をするための技術を開発することである.更には様々な分野における構造化データからの知識発見、情報融合を目指す. 糖鎖は核酸(DNA)とタンパク質に続く3番目に重要な生体分子で、各種の糖が結合した一群の化合物である.糖鎖は木構造をしており、その構造は多様である.そこで、本研究では木構造パターンを用いた糖鎖データからの特徴抽出手法を提案した.木構造パターンとしてタグ木パターンを用いた.タグ木パターンの変数は、任意の木を代入できる構造的な変数であるが、この変数を特別な辺とみなすことができる. そこで、探索には、木構造などの構造的表現を扱うことのできる進化的最適解探索手法である遺伝的プログラミングを用い、パターンの支持度と具体化度に基づいて適合度を与えた.実験では、4つの主要な血液成分である白血球、赤血球、血漿、血清に関する糖鎖データを対象とした.白血球に関与する糖鎖データを正事例とし、それ以外のデータを負事例として、単一のタグ木パターンを生成する試行を行い、特徴的な木構造パターンを得ることができた.また、グラフ構造パターンの学習、帰納的実数値関数の学習、カーネル学習などについても成果を得た.
|
Research Products
(4 results)