1997 Fiscal Year Annual Research Report
Project/Area Number |
07680444
|
Research Institution | Kwansei Gakuin University |
Principal Investigator |
比嘉 真弓 関西学院大学, 情報処理研究センター, 教授 (90103134)
|
Co-Investigator(Kenkyū-buntansha) |
岡田 孝 関西学院大学, 情報処理研究センター, 教授 (00103135)
|
Keywords | 知識発見 / データマイニング / 時系列データ / グラフ構造データ / ルールの発見 / 構文解析木 / 散布図 / 多変量解析 |
Research Abstract |
本研究は、新しい知識発見法を適用し、データ・マイニングを行うことと、知識発見法を使った新しいシステムの開発を行うものであり、研究の進め方を以下に示す。 (1)テーブル形式データを対象とする市販の知識発見用ソフトDatalogic/RおよびIDISを使って、統計的手法では発見しにくかったデータに含まれるルールの発見を目指した探索的なデータ解析をおこなう。 (2)構造を持つデータ、例えば時系列データや構文木などを対象とする分析法を開発する。構造を持つデータを分析するには(2-1)構造自体を種々の観点から数値パラメータ化し、通常の属性/属性値対からなる表式データに変換し(1)の方法で解析する方法、(2-2)知識発見法の分類法であるID3法を拡張して、構造を直接取り扱う新しい分析法を開発する。 平成9年度は、(1)を種々のデータに適用する実験と(2-2)のシステムの開発と応用をおこなった。 1.(1)の方法を使って、ソニー(株)が市販しているマルチメディア関係の調査データの解析を行った。膨大なデータであり現在分析を続行中であるが、これまでの統計手法では見出せなかったルールを発見できた。論文として発表を行う予定である。解析結果は本研究で開発したビジュアル化のためのシステムDLXで表示した。 2.時系列データの予測問題を扱うため、過去の時系列のデータ構造パターンから、これに続くパターンを予測する研究をDatalogic/Rを使って行った。これらは株価等のデータで実験を続行中である。 3.(2-2)の構造を持つデータについては構文解析木の構造を直接扱い分析できる新しい方法論を確立し、アルゴリズムを作成した。本方法は、構文解析木の中で特定の節点を指定しこれをviewpointとしてこの周辺構造のパターンを探索的求めるものである。分析の方法は、解析木の各節点のトポロジー的な属性と構文木のもつ品詞や意味構造などの属性に着目し、これらの属性を統一的に取り扱うためにviewpoint周辺の連結された節点の集合field-of viewを定義し、その内部構造を拡張されてID3法で分析するものである。 4.3.の方法でSYKDシステムの開発をWindows上でC++を用いて行った。システムは使いやすさを考慮してwindows画面で計算制御を行うことができる。 SYKDシステムを日本語の構文木データの解析に適用し、構造上の新しい知識を発見することができた。
|
-
[Publications] 雄山真弓(比嘉): "知識発見法による探索的データ解析" 日本計算機統計学会誌. 9巻1号. 1-12 (1996)
-
[Publications] 雄山真弓: "知識発見法を用いた読点データからの作家の特徴抽出" 関西学院大学情報科学研究. 11号. 53-61 (1996)
-
[Publications] 岡田孝: "知識発見サポートシステムDLX" 関西学院大学情報科学研究. 11号. 23-35 (1996)