1999 Fiscal Year Annual Research Report
木構造データを対象とするデータマイニングツールの開発と応用
Project/Area Number |
11680428
|
Research Institution | Kwansei Gakuin University |
Principal Investigator |
比嘉 眞弓 関西学院大学, 情報メディア教育センター, 教授 (90103134)
|
Co-Investigator(Kenkyū-buntansha) |
岡田 孝 関西学院大学, 情報メディア教育センター, 教授 (00103135)
|
Keywords | 知識発見 / データマイニング / 時系列データ / グラフ構造データ / ルールの発見 / 構文解析木 / 散布図 / 多変量解析 |
Research Abstract |
文の構文木データベースからの知識発見を目的として、下記の各項目につき研究を行った。 (1)命題論理レベルで柔軟なデータマイニングを可能とすることを目的として、カスケードモデルを提案した。 (2)カスケードモデルにおけるルール選択の基準として、カテゴリーデータに対する平方和の利用が可能であることを示し、郡内および群間への分解法を提案した。 (3)上記カスケードモデルに従ってマイニングを行うシステムをCommon Lisp言語により開発し、DISCASソフトウェアとして完成させた。 (4)構文木構造データにおいて、視点となる単語と他の単語群との関連性をアイテムとして表現するための相対節点インデックス化法を提案し、実際にEDRコーパスからアイテムを生成するためのソフトウェアEDRitemを開発した。 (5)英語の動詞thinkには、自動詞と他動詞双方の用法が存在する。EDRコーパス中の文例からこれらの用法毎にアイテム群を生成し、自動詞と他動詞を識別する特徴的な構造パターン有無に関するマイニングを行った。カスケードモデルおよびインテリジェントマイナーによる相関ルール解析を実行したところ、特徴的なパターンが発見された。 次年度以降、発見パターンにつき言語理論的な解析を行うとともに、より効率的なマイニングが行えるように理論、ソフトウェアを発展させ、言語学的に新規な知識の発見を目指して研究を継続する予定である。
|
-
[Publications] Takashi Okada: "Finding Discrimination Rules Using the Cascade Model"人工知能学会誌. 15,2. 321-330 (2000)
-
[Publications] 雄山真弓(比嘉) 岡田孝 黒崎茂樹: "相対インデックス法を使った文構造分析"第5回公開シンポジウム「人文科学とデータベース」. V. 59-66 (1999)
-
[Publications] 雄山真弓,岡田孝: "構文解析木からの知識発見"人工知能学会・人工知能基礎論研究会報告. 38. 45-52 (1999)
-
[Publications] Takashi Okada: "Sum of Squares Decomposition for Categorical Data"関西学院大学情報科学研究. 14. 1-6 (1999)
-
[Publications] Takashi Okada: "Principles of Data Mining and Knowledge Discovery"Springer Verlag Zytokow Ed.. 593 (1999)
-
[Publications] 雄山真弓(比嘉): "人文学と情報処理"勉誠出版. 102 (1999)