配分額 *注記 |
3,200千円 (直接経費: 3,200千円)
2006年度: 1,000千円 (直接経費: 1,000千円)
2005年度: 1,000千円 (直接経費: 1,000千円)
2004年度: 1,200千円 (直接経費: 1,200千円)
|
研究概要 |
本研究課題の目的は,数値属性とグラフ構造を有するハイブリッドデータとみなせるデータを対象として,有益な知識やパターンを発見し,有用な情報を抽出するための理論的基礎を確立し,データマイニシグシステムを実現するこどである. HTML/XMLファイルは木構造データとみなせるので,木構造デ一タから特徴的パターンを発見する手法は有用である.そこで,与えられた正事例と負事例である木構造データから,正事例をすべて説明し,負事例をひとつも説明しない木構造パターンを発見するシステムを,遺伝的プログラミングを応用して実現した.木構造パターンとしてタグ木パターンを用いた.タグ木パターンの変数は,任意の木を代入できる構造的な変数であるが,この変数は表現としては特別な辺とみなせるため,木構造を対象とする遺伝的手法である,遺伝的プログラミングを自然に応用できることがわかった. 実験や観測によって得られた数値データから,そのデータを説明する実数値関数を推論することは,数値データからのデータマイニングを実現するための基本的な学習手法である.帰納的実数とはコンピュータで扱うことのできる実数のことである.そこで,帰納的実数値関数の帰納推論可能性を調べた.自然数上の帰納的関数の予測を拡張して,帰納的実数値関数の予測を無限の過程とみなす推論基準および,有限個の例から帰納的実数値関数を予測する有限予測という推論基準を提案した.帰納的実数値関数の予測,有限予測について,具体的な関数のクラスの推論可能性を調べ,従来からある帰納的実数値関数の帰納推論における推論基準と推論能力を比較した. 半構造データストリームの構造的特徴を抽出するアルゴリズムを提案し,新たなグラフ言語のクラスに対して正データからの多項式時間学習アルゴリズムを与えた.以上が,本研究課題で得た研究成果の概略である.
|