研究分担者 |
櫻井 彰人 慶應義塾大学, 理工学部, 教授 (00303339)
篠沢 佳久 慶應義塾大学, 理工学部, 助手 (80317304)
大崎 美穂 同志社大学, 工学部, 講師 (30313927)
福田 直樹 静岡大学, 情報学部, 助手 (30345805)
阿部 秀尚 島根大学, 医学部, 助手
|
研究概要 |
まず,属性選択メソッドリポジトリを体系化するために,「初期状態の設定」「属性部分集合の評価」「探索操作」「探索の終了判定」という4つの基本メソッドを同定し,過去の属性選択の研究成果に基づき,各基本メソッドを具体化・階層化し,最終的に240種類の属性選択アルゴリズムを再構成可能にした.性能評価実験では,フィルタアプローチ,ラッパーアプローチ(前向き探索),ラッパーアプローチ(後向き探索),シーズメソッド,因子分析とシーズメソッドの組合せ手法と比較し,34種類のUCI MLデータセットを利用して,従来のどの属性選択法より精度が高くなることを確認できた. 次に,ルールの興味深さ指標の調査を進め,最終的に39種類の客観的評価指標をリポジトリ化し,それらの評価値の組み合わせで興味深いルールを選択するためにメタ評価値を,決定木,ニューラルネット,線形回帰で学習したところ,単一評価指標を使用する場合と比べて高い精度を達成できた.さらに,マイニングシステムとユーザのインタラクションを含む半自動的な再構成の手続きを考え,「正解データの収集」「ユーザの思考支援」「興味推定とルール推奨」を動的に行う構成的ルール評価支援ユーザインタフェースを設計し開発した. 最終的に,構成的メタ学習に基づく属性選択,マイニング,ルール選択を統合したシステムを開発し,本研究領域の共通データである慢性肝炎データセットに適用したところ,ある条件下でGPTが約3年周期で変動するという,GPTは単調変化するという定説に反するルールが得られた.実験では,周期変動の原因を突き止めるレベルまでは到達しなかったが,専門医がこの知識に興味をもった点は評価できるといえる.
|