Research Abstract |
不定期の時系列データのために,同一値を取る期間に基づく前処理手法を開発した.さらに,これまでの研究成果を,領域共通の肝炎データおよび化学薬品データの前処理に適用して,成果を集大成した. 肝炎データにおける前処理では、前処理支援システム,前処理データ表現言語,時空間データ構造,同一値を取る期間に基づく前処理の研究を集大成し,計画研究A03-9(津本)と協力して,肝炎データのための前処理工程の自動化を図った.これにより,前処理の手作業工程数を大幅に減らすと同時に,非常に単純で読みやすいルールを得ることができ,後処理の工程数削減にも貢献した.この前処理結果を用いて,マイニングを行ったところ,交差検定の結果が大幅に改善された.得られたルールは医者にも読みやすい形式となり,ルール数を減らすことができ,条件部も単純化して,ユーザの評価も高かった. 化学薬品データにおける前処理は、前処理データ表現言語と,実例の重み付けによるマイニング過程の制御の研究とを集大成し,計画研究A03-10(岡田)と協力して,化学薬品データに適用したところ,マイニング結果の可読性が向上し,交差検定の結果も改善された.自動前処理ステップを導入したことで,本体のマイニング手法には,単純なトップダウン法を採用できた.このため従来よりも,マイニング過程全体の見通しがよくなった.これらの結果をカナダで開催された機械学習国際会議(ICML-2004)で報告したところ,新手法として高い評価が得られ,フルペーバーが会議録に収録された. 上述のように肝炎データと化学薬品データを用いた評価が行え,さらにマイニング結果の質の向上に貢献することができた.
|