Budget Amount *help |
¥1,400,000 (Direct Cost: ¥1,400,000)
Fiscal Year 2010: ¥700,000 (Direct Cost: ¥700,000)
Fiscal Year 2009: ¥700,000 (Direct Cost: ¥700,000)
|
Research Abstract |
大規模記憶装置や高速なネットワークの発展などによって大規模なデータベースの中から有用な規則を発見するデータ間イニングの研究が盛んになっており,特にウェブページやXML文書に代表される半構造データの利用が進んでいる.ここでいう半構造データとは,関係データベース(RDB)のような厳密な構造は持ってはいないが,自由度の高い構造を有しているデータのことである.このような理由から半構造データの利用は急速に進んでおり,データに対する効率のよい解析手法が求められているが,半構造データはRDBなどと違い,明示的な構造を持たないので,RDBを対象とした従来のデータマイニング手法をそのまま半構造データに適用することは困難である.これに対し本研究では,ゼロサプレス型二分決定グラフ(ZDD)を半構造データの解析処理に対して応用することで,膨大な数のアイテム組合せの情報を効率よく抽出し,解析することを目的とする. 本年度は,これまでの研究成果を踏まえて,データベース解析に用いられる手法について比較,検討を行った.具体的には,ZDDを用いてデータベース解析を行う手法として提案されたZDD-Vectorと重み付きZDD(WZDD)について,人工的に生成したデータベースを用いてそれぞれの手法の性質の違いを示した.これに関して,第4回IBISML研究会で口頭発表を行い,一連の研究をまとめた論文を執筆中である.
|