2006 Fiscal Year Annual Research Report
罫線文書を対象にした機械学習手法の開発とデータマイニングへの応用
Project/Area Number |
17700159
|
Research Institution | Hiroshima City University |
Principal Investigator |
鈴木 祐介 広島市立大学, 情報科学部, 助手 (10398464)
|
Keywords | 機械学習 / データマイニング / グラフ構造パターン / 罫線文書 |
Research Abstract |
平成18年度は次の課題に重点を置いて研究を行い,以下のような知見等を得た. 1.罫線文書のグラフ表現方法の確立に関する研究:TTSPグラフを用いて罫線文書を表現する方法を考案した.またそのTTSPグラフを木構造データとして表現し,その木構造データに共通するパターンを抽出する方法として変数付き連結経路パターンの提案を行った.またそのパターンの生成する言語が多項式時間機械学習可能であることを示した. 2.また他のグラフ構造パターンの学習のために,いくつかの種類の項木の機械学習可能性を新たに考察した.特に木構造データを表現する項木が複数存在する場合についての機械学習可能性について考察した. 3.計算機実験:2で提案した機械学習アルゴリズムの一部を計算機上で実装し,その評価実験を行った. 本年度の研究によって,木構造データに共通する複数の項木を発見することが可能になった.これを用いることでより詳細なデータマイニングを行うことが可能であると考えられる. またTTSPグラフからのパターン発見のために変数付き連結経路パターンの学習可能性を考察したことで,前年度の研究とあわせてTTSPグラフから,ひいては罫線文書からのデータマイニングをより有効に行えるようになったと考えられる。 項木や変数付き連結経路パターンは罫線文書を表現する方法としてはまだ不十分であると考えられる.そこで次年度ではこれらのパターンを踏まえ,より詳細に罫線文書を表現できるパターン提案し,その学習可能性について考察する予定である.
|