2003 Fiscal Year Annual Research Report
ラベル付き・ラベル無しデータを統合的活用する共学習システムの構築方法に関する研究
Project/Area Number |
14780280
|
Research Institution | Osaka University |
Principal Investigator |
吉田 哲也 大阪大学, 産業科学研究所, 助手 (80294164)
|
Keywords | グラフ構造データ / 決定木 / 学習システム / チャンキング / 肝炎データ |
Research Abstract |
研究実績は以下のとおり. 1.初年度に検討した,グラフ構造データを対象として決定木を構築する学習アルゴリズムであるDecision Tree Graph-based Induction (DT-GBI)法をDNAデータベースに適用し,promoter活性の有無に基づくDNAデータの分類を通じた性能評価を行った. 2.1.で実施した性能評価に基づき,DT-GBI法のアルゴリズムを下記の3点に対して改良した.A:DT-GBI法のアルゴリズムにおいて部分構造をボトムアップに成長させるチャンキング操作の適用回数を可変にし,決定木の各ノードで成長させるパターンのサイズを制御可能とする.B:部分構造探索にビーム探索を導入して探索能力を改善する.C:決定木の枝刈り操作を導入し,分類精度向上を実現する. 3.2.で実施した3種類の改良を思索したプロトタイプシステムに実装し,それぞれをパラメータとして1.と同じDNAデータベースに適用し,グラフ構造データに対して構築する決定木の精度向上への効果を評価した.また,データ分割のために抽出するパターン(部分構造)と領域知識との整合性を評価し,領域知識に合致した部分構造が抽出されることを確認した. 4.さらに,DT-GBI法の実問題への適用例として,千葉大学医学部付属病院から提供いただいた肝炎データに適用した.各患者の肝臓の線維化程度の分類と肝炎の型の分類問題に適用し,3.と同様,DT-GBI法により構築した決定木の分類精度を評価し,良好な予測精度が得られることを確認した.また,抽出したパターンを専門家(医師)により評価いただき,領域知識に合致したパターンが抽出されることも多いが,解釈しにくいパターンもデータの分類に用いられているという課題が残ることを確認した.
|
Research Products
(4 results)
-
[Publications] Warodom Geamsakul: "Performance Evaluation of Decision Tree Graph-Based Induction"Fifth International Conference on Discovery Science (Springer Verlag LNAI2843). 128-140 (2003)
-
[Publications] Kensuke Ohnishi: "A Method for Detecting Conceptual Difference based on Correlation between Decision Trees"Systems and Computers in Japan. 38・2. 25-38 (2004)
-
[Publications] Warodom Geamsakul: "Analysis of Hepatitis Dataset by Decision Tree based on Graph-Based Induction"Springer Velarg LNAI. (to appear). (2004)
-
[Publications] Tetsuya Yoshida: "Adaptive Ripple Down Rules Method based on Minimum Description Length Principle"Intelligent Data Analysis. (to appear). (2004)