研究課題/領域番号 |
10111231
|
研究種目 |
特定領域研究(A)
|
配分区分 | 補助金 |
研究機関 | 関西学院大学 |
研究代表者 |
比嘉 眞弓 関西学院大学, 情報処理研究センター, 教授 (90103134)
|
研究分担者 |
岡田 孝 関西学院大学, 情報処理研究センター, 教授 (00103135)
|
研究期間 (年度) |
1998
|
研究課題ステータス |
完了 (1998年度)
|
配分額 *注記 |
1,500千円 (直接経費: 1,500千円)
1998年度: 1,500千円 (直接経費: 1,500千円)
|
キーワード | 構文解析木 / 知識発見 / 多変量解析 / 人文データ / データマイニング / 時系列データ / 文学作品 / グラフ構造データ |
研究概要 |
データマイニング技術を構文木情報が付加されたコーパスデータへ適用することによって、構文木の構造情報から特徴的な部分構造を発見する手法の研究・開発およびシステムの開発を行ってきた。研究実績の概要は以下の通りである。 (1) コーパスデータの解析法について市販のデータマイニングソフトDatalogic/Rなどを使ってテーブル型データの分析をおこなった。新聞上の小説と天声人語などの文章、数十件について構造そのものを分析する方法論を考案し、机上計算を行ってプロトタイブの実験を行った。 (2) 構文解析木からの知識発見システムSYKDを作成し、EDRコーパスを購入し実験を行った。知識は得られたが方法論の一部修正が必要であることに気付く。 (3) (2)の修正を加え、構文解析木からの知識発見システムSYKDを完成。さらにコーパスデータからSYKD用にデータ変換するソフトPToDefの開発を行う。 (4) SYKDシステムを使って、EDRコーパスをデータとして助詞「が」、「は」なとの分析を行う。また、同時に発見されたパターンをキーワードとして大量のコーパスから検索を行うためのソフトウェアの開発。EDRコーパスをつかって十数万文例について実験を行う。 (5) 構造とその周辺の属性を調べるためのデータマイニング手法として相対節点インデックス化によるデータ表現とデータマイニング手法として相関ルール探索法を使う分析手法を新たに考案。 (6) 相対節点インデックス化と相関ルール探索法の組み合せは、構造情報のみでなくより詳細な節点の属性の関係を多く発見できる可能性を実証した。 (7) 相関ルール探索法は、市販のIntelligent Minerを使うことに決定し、現在、各種のコーパスデータから入力データを作成するためのシステム開発を行っている。
|