2001 Fiscal Year Annual Research Report
データマイニングにおけるデータ収集過程の見習い獲得手法
Project/Area Number |
13480090
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
沼尾 正行 東京工業大学, 大学院・情報理工学研究科, 助教授 (30198551)
|
Keywords | 機械学習 / エージェント / 人工知能 / データマイニング / 医療情報 |
Research Abstract |
GIANTのネットワークは元々Webやニュースのフィルタリングを行うように作られている。これにデータマイニングの要素モジュールを組込む作業を初年度に購入するパーソナルコンピュータネットワーク上で行った。具体的には、決定木の学習システムC4.5,相関ルールの生成システム、前処理の各種基本演算をGIANTのネットワークに組み込んだ。GIANTでは、ネットワークのリンクをルールで記述するようになっている。これにより、モジュール間のデータの受け渡しおよび各種計算がルールで表現できる。したがって、上の作業により、前処理の流れをルールで記述できるようになった。ルールには重みがついており、重みに応じて試行錯誤的な処理が記述される。現在、海外の学会ではデータマイニングの技術を評価するため、共通課題によるマイニングが盛んである。本技術の中間的な成果について、外国旅費を用いて海外の学会で発表すると同時に、これらの共通課題にも取り組んだ。 データに関しては、平成11年度に感染症についてのかなり大規模で詳細な医療情報を収集している。さらに、データマイニング関係の研究会において、継続的に医療情報が提供されている。それらの中には前処理の方法も含まれているので、これをルール化して知識ベースを作成する作業を行った。そのようなデータ収集を行うため、調査、研究旅費を用いて、収集現場に出向き、打合せおよび作業を行った。さらにデータマイニングの結果を(半)自動的に評価するための評価ルールも作成した。
|
-
[Publications] Masayuki Numao, Daishi Kato, Masaru Yokoyama: "Learning organization in global intelligence"AAAI Spring Symposia. (2002)
-
[Publications] Cholwich Nattee, Masayuki Numao: "Geometric method for document understanding and classification using on-line machine learning"Sixth International Conference on Document Analysis and Recognition. 602-606 (2001)
-
[Publications] Tuan Nam Tran, Masayuki Numao: "Text data mining in biomedical literature by combining with an information retrieval approach"Proc. the 14th International Conference on Applications of Prolog. 295-304 (2001)
-
[Publications] Chowdhury Rahman Mofizur, Masayuki Numao: "Automated bias shift in a constrained space for logic program synthesis"人工知能学会論文誌. Vol.16, No.6. 548-556 (2001)
-
[Publications] 沼尾正行: "Global intelligenceによる知識流通"情報処理学会知能と複雑系研究会. Vol.01-ICS-124. 1-8 (2001)
-
[Publications] 沼尾正行, 吉田匡志, 伊藤雄介: "ロコミに基づく情報収集とデータ前処理"人工知能学会第46回人工知能基礎論/第54回知識ベースシステム研究会. 第SIG-FAl/KB S-J巻. 47-54 (2001)