2002 Fiscal Year Annual Research Report
ラベル付き・ラベル無しデータを統合的活用する共学習システムの構築方法に関する研究
Project/Area Number |
14780280
|
Research Institution | Osaka University |
Principal Investigator |
吉田 哲也 大阪大学, 産業科学研究所, 助手 (80294164)
|
Keywords | ラベル付きデータ / ラベル無しデータ / 決定木 / クラスタリング |
Research Abstract |
研究実績は以下のとおり. 1.共学習システムを構築する際に用いる学習アルゴリズムとして,グラフ構造データを対象とし,ラベル付きデータに対してグラフ構造に対する決定木構築アルゴリズム,ラベル無しデータに対してグラフクラスタリングアルゴリズムを検討した. 2.決定木構築アルゴリズムに対して,データに含まれる部分グラフの特徴に基づいて分類に効果的な部分構造(部分グラフ)を再帰的に抽出し,抽出した部分構造を属性として利用して決定木を構築する手法を検討した.検討した手法は分類に使用する属性をオンラインで構築するため,属性構築の一手法とみますことができる. 3. 2.で検討したアルゴリズムを計算機上にプログラムとして実装し,実データ(DNA promoterデータセット)を対象としてその基本性能(分類制度)を検証した.その結果,領域知識を用いて構築した分類器と同等の分類制度を持つ分類器(決定木)が構築されることを確認し,事前に領域知識が得られないデータに対しても分類精度の高い分類器を構築する可能性を示唆した. 4. 3.で実装したプログラムが抽出する部分構造(部分グラフ)をラベル無しデータとみなし,部分グラフの構造的類似性に基づくグラフクラスタリング手法を検討した.グラフに含まれる部分グラフの頻度をスペクトルとして表現し,スペクトル間の類似度に基づいてグラフ間の類似度を計測してクラスタリングを行う手法を検討した.人工データを用いた評価実験を通じ,グラフの頂点数や辺数に関して有効であることを確認したが,形状の類似性に対して課題が残ることも確認した.
|
Research Products
(4 results)
-
[Publications] 大西健介, 吉田哲也, 西田正吾: "決定木の相関関係に基づいた概念相違検出手法"電子情報通信学会論文誌D-1. J85・8. 784-797 (2002)
-
[Publications] 新開大樹, 吉田哲也, 西田正吾: "検索キーワード間の関連性を用いた情報獲得支援システム"ヒューマンインタフェース学会論文誌. 4・4. 207-217 (2002)
-
[Publications] Takashi Matsuda: "Active Mining from Hepatitis Data by Beam-wise GBI"International Workshop on Active Mining (AM-2002), working notes. 37-44 (2002)
-
[Publications] Warodom Geamsakul: "Classifier Construction by Graph-Based Induction for Graph-Structured Data"Seventh Pacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD2003). (2003)