2010 Fiscal Year Annual Research Report
地図・罫線文書等を含むウェブデータを対象としたマイニング手法の開発
Project/Area Number |
22700153
|
Research Institution | Hiroshima City University |
Principal Investigator |
鈴木 祐介 広島市立大学, 情報科学研究科, 助教 (10398464)
|
Keywords | 機械学習 / データマイニング / 知識発見 |
Research Abstract |
平成22年度は次の課題に重点を置いて研究を行い,以下のような知見等を得た. ウェブ上に存在する平面データの表現方法および,共通するパターンの発見に関する研究として,TTSPグラフに変数の概念を導入したTTSPグラフパターンのマイニング手法について考察を行った.TTSPグラフは電気ネットワークやスケジューリングなどの平面データを表現可能なグラフ構造である.本研究では,TTSPグラフ構造を有するデータに頻出するTTSPグラフパターンを枚挙するマイニングアルゴリズムを提案した.また提案したアルゴリズムをコンピュータ上に実装し,その評価実験を行った. またHTML/XMLファイルなどの,木構造で表現されるウェブ上のデータに共通する木構造パターンを発見するアルゴリズムの開発と改良を行った.また発見されたパターンを利用して,DOM,XSLTなどの)XML変換言語を用いたXMLファイルからのデータ抽出手法についての研究を行った.提案したパターン発見手法や,XMLファイルからのデータ抽出アルゴリズムをコンピュータ上に実装し,その評価実験を行った. 本年度の研究によって,TTSPグラフで表現可能な平面データに共通するパターンの抽出が可能になった.この研究成果を用いて,TTSPグラフで表現可能な実データに対する実験や,より効率の良いマイニングアルゴリズムの提案等を行っていく予定である.
|