研究課題/領域番号 |
11680428
|
研究機関 | 関西学院大学 |
研究代表者 |
雄山 真弓 関西学院大学, 文学部, 教授 (90103134)
|
研究分担者 |
岡田 孝 関西学院大学, 情報メディア教育センター, 教授 (00103135)
|
キーワード | 知識発見 / データマイニング / ルールの発見 / 構文解析木 / コーパスデータ / グラフ構造データ / 多変量解析 / 相関ルール探索法 |
研究概要 |
英語・日本語等、木構造を持つコーパスデータに着目し、木構造と構造自体に付随する単語と品詞を含めて何らかの構造上のルールを見つけ出し、新たな言語の知見を求めるために、以下の研究を行ってきた。研究の実績を以下に示す。 1.導出されるルールの表示を簡明にする目的で、コーパスデータを相対インデックス化データにするとともに、意味距離と方向性の属性を加えたデータ変換ソフトの改良をLISP言語で作成した。(研究分担者:岡田) 2.Intelligent Minerの作動と意味距離を含むテストデータの実験を行った。所属機関がデータマイニング関係の研究用に既に設置しているRX600(IBM)上のIntelligent Minerを用いるため、IBM PC710とネットワーク接続を行って実験を行った。(研究代表者:雄山) 3.データマイニング手法の1つである相関ルール探索法について実験をおこなった。(研究代表者:雄山、研究分担者:岡田) 4.相対節点インデックス化データを使ってデータベースの構築を行った。(研究代表者:雄山、研究分担者:岡田) 5.相対節点インデックス化を行った数千件のコーパスデータを使って相関ルール探索(英語と日本語の動詞を中心に)を行った。(研究代表者:雄山、研究分担者:岡田) 6.導出されたルールの最適化を行うためのパラメータやフィルタリング。作図化を行った。(研究代表者:雄山) 7.発見パターンにつき言語理論的な解析を行うと共に、より効果的なマイニングが行えるように理論を深め、図式化のためのソフトの開発をおこなった。(研究代表者:雄山)
|