研究課題/領域番号 |
07680444
|
研究種目 |
一般研究(C)
|
研究機関 | 関西学院大学 |
研究代表者 |
雄山 真弓 関西学院大学, 情報処理研究センター, 教授 (90103134)
|
研究分担者 |
岡田 孝 関西学院大学, 情報処理研究センター, 教授 (00103135)
|
キーワード | 知識発見 / データマイニング / 時系列データ / グラフ構造データ / ルールの発見 / 構文解析木 / 散布図 / 多変量解析 |
研究概要 |
平成7年度は、下記のような項目について研究を行った。 1.テーブル形式を対象とした市販の知識発見用Datalogic/RおよびIDISを利用して、判別分析や数量化理論において有名なIrisデータと循環器系疾患データ、および多数の説明変数が存在する構造活性相関データの解析を実行した。その結果、これらの方法が非常に理解しやすい形式で仮説を提示するため、今後データ解析において有効に活用しうることを確認した。また、解析を効率的に実行するためのパラメータ設定の方法を確認することができた。これらの成果は、情報科学研究および計算機統計学会論文誌(投稿中)に発表した。 2.上記の結果を視察する際に、ルールを散布図中で表現することが不可欠であることが判明した。そこで、ExcelとVisual Basicを用いて、ルールに対応する散布図およびクロス表を簡便に表示し、しかもその上にルール領域を表示するシステムDLXを作成した。 3.時系列データをグラフ構造化して表現し、その構造を直接にID3アルゴリズムによって取り扱うための方法論を見出した。さらに、これらの構造化されたデータを実際に処理するためのシステムをWindows上にC++によって実現した。次年度は、このシステムを用いて、UCIデータバンク中のバッハのコラール、および経済時系列データの予測問題を取り扱う予定である。 4.データセット中のケース毎にグラフ構造自体が変化するような問題、例えば構文解析木を、上述のようにID3アルゴリズムで取り扱う方法を考察した。現在手計算により、非常に少数の文例のみを解析している段階であるが、それでも通常の統計的方法では容易に知り得ないような、構文の特徴を見出すことができた。今後、この方法論に沿ったシステムの開発を進める予定である。
|