現代のAIでは,適切な結果を得るためには膨大な数の学習サンプルを必要とする.一方,観測が困難であったり再現が難しいなど,多数の学習サンプルを準備することが難しい課題も存在する.本研究では,学習データを補うため数理モデルを作成し,モデルに従って学習サンプルを生成することで精度よく学習が行うことが可能なアプローチを模索した.例題として,たんぱく質発現量から生理活性値を推定する問題,および学習データ数は豊富なものの信頼性に疑義があるコンピュータシステムへの侵入検知問題を取り上げた.前者については推定プログラムを作成し,後者についてはブースティングを併用した決定木アプローチが有効であることを示した.
|