2005 Fiscal Year Annual Research Report
罫線文書を対象にした機械学習手法の開発とデータマイニングへの応用
Project/Area Number |
17700159
|
Research Institution | Hiroshima City University |
Principal Investigator |
鈴木 祐介 広島市立大学, 情報科学部, 助手 (10398464)
|
Keywords | 機械学習 / データマイニング / グラフ構造パターン / 罫線文書 |
Research Abstract |
平成17年度は次の課題に重点を置いて研究を行い,以下のような知見等を得た. 1.罫線文書のグラフ表現方法の確立に関する研究:TTSPグラフに変数の概念を導入したTTSP項グラフというグラフ構造パターンを提案した.TTSPグラフは始点(ソース)及び終点(シンク)を持つグラフで,これらを罫線文書の左上隅と右下隅の対応させることで,罫線文書の表現に応用可能であると考えられる. 2.TTSP項グラフの機械学習可能性の考察:項木という木構造を持つグラフ構造パターンの機械学習可能性を拡張することで,TTSP項グラフの機械学習可能性を考察し,多項式時間機械学習可能であることを示した. 3.2に関して,他のグラフ構造パターンの学習のために,いくつかの種類の項木の機械学習可能性を新たに考察した.特に変数の高さに制限のある項木の機械学習可能性を考察するために,所属性問題を高速に解くアルゴリズムを提案した.またデータマイニングのための列挙アルゴリズムを提案し,応用について考察した. 本年度の研究によって,項木の機械学習手法を拡張することで,いくつかの種類のグラフ構造パターンの機械学習可能性を考察することが可能であることが分かった.また項木の機械学習可能性の基礎を固めることができた. TTSP項グラフの機械学習可能性を示すことが出来たが,TTSP項グラフでは罫線文書の構造を十分に表現できず表現方法としては不十分であると思われる.よって来年度は,TTSP項グラフを拡張したグラフ等,罫線文書のよりよい表現方法の確立及びその機械学習手法の開発について取り組む予定である.
|