本研究は、新しい知識発見法を適用し、データ・マイニングを行うことと、知識発見法を使った新しいシステムの開発を行うものであり、研究の成果は以下の通りである。 1.テーブル形式データを対象とする市販の知識発見用ソフトDatalogic/RおよびIDISを使って、統計的手法では発見しにくかったデータに含まれるルールの発見を目指した探索的なデータ解析をおこなった。 (1)知識発見法により解析を行った結果をビジュアル化するためのシステムDLXを開発した。 (2)作家(三島由起夫、井上靖、谷崎潤一郎、中島敦)の文体を分析し特徴抽出を行い発表した。 (3)ソニー(株)が市販しているマルチメディア関係の調査データの解析を行った。膨大なデータであり現在分析を続行中であるが、これまでの統計手法では見出せなかったルールを発見できた。 (4)時系列データの予測問題を扱うため、過去の時系列のデータ構造パターンから、これに続くパターンを予測する研究をDatalogic/Rを使って行った。これらは株価等のデータで実験を続行中である。 2.構造を持つデータ、例えば時系列データや構文木などを対象とする分析法を開発した。 (1)構造を持つデータについては構文解析木の構造を直接扱い分析できる新しい方法論を確立し、アルゴリズムを作成した。 (2)(1)の方法でSYKDシステムの開発をWindows上でC++を用いて行った。システムは使いやすさを考慮してwindows画面で計算制御を行うことができる。 (2)SYKDシステムを日本語の構文木データの解析に適用し、構造上の新しい知識を発見することができた。
|