研究概要 |
数値や符号化された多次元の属性値を持つ,詳細データの履歴や個別プロファイル情報が,データウェアハウスやデータマート上に大量に存在するとき,データからの知識発見のために,ニューラル・ネットワークを用いたデータマイニング・モデルを評価する新しい情報数理工学的手法を開発することが本研究の目的である.平成11年度においては,大学に着任したばかりでゼロからのスタートであったので,主として研究遂行上必要となるコンピュータ環境の整備から実施した.同時に,筑波大学大学院博士課程社会工学研究科3年次の指導学生Georges Dupret(国費留学生)と共同研究を行ない,統計分布に大きな偏りがあるようなデータに対してニューラル・ネットワーク・アルゴリズムを適用する場合に問題となる,学習用トレーニング・データのサンプリングについて,統計学に基礎を有するブートストラップ法による新しい評価法を開発した.特に,2値クラス分類の場合のデータ・サンプリングが学習結果に与える影響(誤判別に与えるコスト)について,基本的な仮定を設定した上で理論的に解析を行なった.研究結果は京都大学数理解析研究所の短期共同研究「確率数値解析における諸問題,IV」としての同研究所講究録1127号に発表予定(印刷中)である.また,同研究を拡張した結果が国際会議APORS2000でもフルペーパーとして受理され,平成12年7月に発売予定である.更に,この結果を拡張した研究成果に基くGeorges Dupretの博士請求論文と,共著での審査付き学術誌への投稿を現在準備中である. また,共同研究者の北陸先端科学技術大学院大学の吉田武稔助教授と筑波大学社会工学系鈴木秀男講師とは,データマイニング技術の生産スケジューリング問題への応用と,マイニング・モデル構築へのMDL情報量基準の応用について,それぞれ共同研究を順調に実施中である.
|