Budget Amount *help |
¥3,800,000 (Direct Cost: ¥3,800,000)
Fiscal Year 2004: ¥1,000,000 (Direct Cost: ¥1,000,000)
Fiscal Year 2003: ¥1,600,000 (Direct Cost: ¥1,600,000)
Fiscal Year 2002: ¥1,200,000 (Direct Cost: ¥1,200,000)
|
Research Abstract |
研究実績は以下のとおり. 1.初年度,次年度に検討した,グラフ構造データを対象とする学習アルゴリズム(ラベル付きデータに対するDecision Tree Graph-based Induction (DT-GBI)法,および,ラベル無しデータに対するBeam-wise Graph-based Induction (B-GBI法))実問題に適用した場合,抽出される知識(部分グラフ)は例外を多く含み,正確性に欠けるという問題があった.この問題を解決するため,学習アルゴリズムで抽出した部分グラフを制約として更に活用し,得られた知識(部分グラフ)の精緻化を行う方法を考案し,実装した. 2.1.を実現する際,制約として活用する部分グラフの包含関係を確認するために部分グラフの同型問題を解く必要があるが,この問題はNP完全であり,大規模なデータを対象とする場合に計算時間が問題となる.この問題に対し,GBI法はもともとGreedy探索に基づく手法あることを考慮し,正確性よりも高速性を重視し,GBI法を活用した部分グラフ同型問題の近似解法を考案し,実装し,1.の手法に導入した. 3.次年度に引き続き,実問題への適用例として,千葉大学医学部付属病院から提供いただいた肝炎データに適用した.各患者の肝臓の線維化程度,肝炎の型(B・C)に加え,新たにインターフェロンの効用予測問題に適用した.DT-GBI法により構築した決定木の分類精度を評価し,また,DTGBI法およびB-GBI法で抽出した部分グラフを1.の手法を用いて精緻化した知識(部分グラフ)の妥当性を,専門家(医師)により評価いただいた. 4.本研究課題を通じて開発した手法および得られた知見(UCIのpromoterデータと3.の肝炎データを対象)を整理して海外の学術論文に投稿し,受理された.
|