1998 Fiscal Year Annual Research Report
Project/Area Number |
10111231
|
Research Institution | Kwansei Gakuin University |
Principal Investigator |
比嘉 眞弓 関西学院大学, 情報処理研究センター, 教授 (90103134)
|
Co-Investigator(Kenkyū-buntansha) |
岡田 孝 関西学院大学, 情報処理研究センター, 教授 (00103135)
|
Keywords | 構文解析木 / 知識発見 / 多変量解析 / 人文データ / データマイニング / 時系列データ / 文学作品 / グラフ構造データ |
Research Abstract |
データマイニング技術を構文木情報が付加されたコーパスデータへ適用することによって、構文木の構造情報から特徴的な部分構造を発見する手法の研究・開発およびシステムの開発を行ってきた。研究実績の概要は以下の通りである。 (1) コーパスデータの解析法について市販のデータマイニングソフトDatalogic/Rなどを使ってテーブル型データの分析をおこなった。新聞上の小説と天声人語などの文章、数十件について構造そのものを分析する方法論を考案し、机上計算を行ってプロトタイブの実験を行った。 (2) 構文解析木からの知識発見システムSYKDを作成し、EDRコーパスを購入し実験を行った。知識は得られたが方法論の一部修正が必要であることに気付く。 (3) (2)の修正を加え、構文解析木からの知識発見システムSYKDを完成。さらにコーパスデータからSYKD用にデータ変換するソフトPToDefの開発を行う。 (4) SYKDシステムを使って、EDRコーパスをデータとして助詞「が」、「は」なとの分析を行う。また、同時に発見されたパターンをキーワードとして大量のコーパスから検索を行うためのソフトウェアの開発。EDRコーパスをつかって十数万文例について実験を行う。 (5) 構造とその周辺の属性を調べるためのデータマイニング手法として相対節点インデックス化によるデータ表現とデータマイニング手法として相関ルール探索法を使う分析手法を新たに考案。 (6) 相対節点インデックス化と相関ルール探索法の組み合せは、構造情報のみでなくより詳細な節点の属性の関係を多く発見できる可能性を実証した。 (7) 相関ルール探索法は、市販のIntelligent Minerを使うことに決定し、現在、各種のコーパスデータから入力データを作成するためのシステム開発を行っている。
|
-
[Publications] 雄山(比嘉)眞弓・岡田孝 他: "構文木からの知識発見システム" 関西学院大学情報科学研究. 13号. 51-59 (1998)
-
[Publications] 雄山眞弓・岡田孝 他: "構文解析木データからの知識発見システム" 信学技術(電子情報通信学会). Vol.98. 25-32 (1998)
-
[Publications] 雄山眞弓・岡田孝: "構文解析木を対象とするデータマイニング" 情報処理学会 人文科学とコンピュータ研究報告. 40-3. 17-24 (1998)
-
[Publications] 岡田孝・雄山眞弓: "Graphminer.グラフ構造からのデータマイニングシステム" 情報化学討論会講演要旨集. 21. 28-31 (1998)
-
[Publications] 岡田孝・雄山眞弓: "カスケードモデルによる共通データの解析" 人工知能学会 SIG-KBS. 02-12. 75-82 (1998)
-
[Publications] 雄山眞弓・岡田孝: "構文解析木を対象とするデータ解析法の研究-構文木からの知識発見システム SYKDの開発と応用-" 情報処理学会研究報告 98-CH-38. Vol.98,No.51. 69-77 (1998)
-
[Publications] 岡田孝: "教師付き学習法によるデータ解析の統一的枠組みを目指して" データ科学におけるデータマイニングと知識発見論文集. 1(未定). (1999)
-
[Publications] 津本他(岡田・雄山含む): "Comparison of Data Mining Methods Using Common Medical Datasets" データ科学におけるデータマイニングと知識発見論文集. 1(未定). (1999)