研究概要 |
本研究課題では,数値属性とグラフ構造を有するハイブリッドデータからのデータマイニングについて研究を行い,本年度は次の成果を得た. 本研究の目的は,コンピュータ上,インターネット上に存在するデジタルデータのうちで,数値属性とグラフ構造を有するハイブリッドデータとみなせるデータを対象として,有益な知識やパターンを発見し,有用な情報を抽出するための理論的基礎を確立し,データマイニングシステムを実現することである. Webデータ,HTML/XMLファイルからの情報抽出を行い,タグ情報,テキスト情報,数値データなどに分けて,データを切り出す.タグの解析木と数値データを組み合わせて,タグを属性とみなし,対応する数値データを,その属性値とみなしてデータマイニングを行う.このアプローチを,帰納的実数を用いる枠組みへ拡張する. 実験や観測によって得られた数値データから,そのデータを説明する実数値関数を推論することは,数値データからのデータマイニングを実現するための基本的な学習手法である.帰納的実数とはコンピュータで扱うことのできる実数のことである.そこで,帰納的実数値関数の帰納推論可能性を調べた.まず,自然数上の帰納的関数の予測を拡張して,帰納的実数値関数の予測を無限の過程とみなす推論基準を考えた.さらに,有限個の例から帰納的実数値関数を予測する有限予測という推論基準を提案した.帰納的実数値関数の予測,有限予測について,具体的な関数のクラスの推論可能性を調べ,従来からある帰納的実数値関数の帰納推論における推論基準と推論能力を比較した.
|