研究課題/領域番号 |
11680428
|
研究機関 | 関西学院大学 |
研究代表者 |
比嘉 眞弓 関西学院大学, 情報メディア教育センター, 教授 (90103134)
|
研究分担者 |
岡田 孝 関西学院大学, 情報メディア教育センター, 教授 (00103135)
|
キーワード | 知識発見 / データマイニング / 時系列データ / グラフ構造データ / ルールの発見 / 構文解析木 / 散布図 / 多変量解析 |
研究概要 |
文の構文木データベースからの知識発見を目的として、下記の各項目につき研究を行った。 (1)命題論理レベルで柔軟なデータマイニングを可能とすることを目的として、カスケードモデルを提案した。 (2)カスケードモデルにおけるルール選択の基準として、カテゴリーデータに対する平方和の利用が可能であることを示し、郡内および群間への分解法を提案した。 (3)上記カスケードモデルに従ってマイニングを行うシステムをCommon Lisp言語により開発し、DISCASソフトウェアとして完成させた。 (4)構文木構造データにおいて、視点となる単語と他の単語群との関連性をアイテムとして表現するための相対節点インデックス化法を提案し、実際にEDRコーパスからアイテムを生成するためのソフトウェアEDRitemを開発した。 (5)英語の動詞thinkには、自動詞と他動詞双方の用法が存在する。EDRコーパス中の文例からこれらの用法毎にアイテム群を生成し、自動詞と他動詞を識別する特徴的な構造パターン有無に関するマイニングを行った。カスケードモデルおよびインテリジェントマイナーによる相関ルール解析を実行したところ、特徴的なパターンが発見された。 次年度以降、発見パターンにつき言語理論的な解析を行うとともに、より効率的なマイニングが行えるように理論、ソフトウェアを発展させ、言語学的に新規な知識の発見を目指して研究を継続する予定である。
|