研究概要 |
本研究の目的は,データマイニングに関して既に得られている数理モデルの特長を拡張し,従来のデータベース技術や統計的手法の利点を活用して,新しいデータマイニング・モデルの構築と解析を行い,さらにシミュレーションやテストデータにより評価・検証して,モデルの特性を明らかにすることであった.この目的に沿って研究を行なった結果,下記の結果を得た. 1.確率感度解析による新しい確率的学習アルゴリズムの導出 データからの知識発見のために,ニューラルネットワークなどの機械学習手法を用いたデータマイニング・モデルにおいて,データの不確定性やノイズ,予測不可能な変動などがモデルの推論結果に与える影響の度合いを確率感度解析によって定量的に評価し,それにもとづいたニューラルネットワークの新しい確率的学習アルゴリズムの定式化に成功した. 2.ブートストラップ手法の最適リサンプリングへの応用 データマイニングの実際の応用においては,学習用データが統計的に偏ったり不充分な量の教師データしか得られないケースによく遭遇するが,統計的に大きく偏ったデータからの知識発見のために,復元を許したリサンプリング手法であるブートストラップ法の適用を提案し,シミュレーションによりその有効性を検証した.さらに,学習データの複合的組み合わせを繰り返して交叉検証(Cross-Validation)を行う場合にも,本提案手法を拡張してデータマイニング・モデルの汎化能力を改善できることを明らかにした. 3.データマイニングの製造スケジューリングや工程管理への応用 データマイニングの新しい応用分野として,生産データ解析における相関(Association)分析やMDL(最小記述長)などの情報量基準の適用について考察を行ない,最適スケジューリングや工程管理手法を提案した.本研究で提案した手法の有効性を数値実験により定量的に示した.
|