研究課題/領域番号 |
16300087
|
研究機関 | 立教大学 |
研究代表者 |
山口 和範 立教大学, 社会学部, 教授 (60230348)
|
研究分担者 |
竹内 光悦 実践女子大学, 人間社会学部, 講師 (60339596)
渡辺 美智子 東洋大学, 経済学部, 教授 (50150397)
中川 重和 倉敷芸術科学大学, 産業科学技術学部, 助教授 (90248203)
黒田 正博 岡山理科大学, 総合情報学部, 助教授 (90279042)
酒折 文武 立教大学, 社会学部, 助手 (90386475)
|
キーワード | 不完全データ / EMアルゴリズム / 潜在クラスモデル |
研究概要 |
データ分析において、欠測値などを含む不完全データの分析に関する問題は、欠かすことのできない重要な課題である。本研究では、不完全データの処理に関して、計算機を積極的に活用して、次のような2つのアプローチを試みた。1つは、尤度に基づく推定問題を考える際に仮定される"欠測がランダム"であるという前提の評価を行う手法の研究である。ここでは、この前提が成立しているかどうかを直接チェックするのではなく、実際のデータがその前提とどの程度の乖離の可能性があり、その乖離が推定結果にどのような影響を与えるのかを知るための手法開発を行っている。2つめは、事前知識を利用して欠測メカニズムの候補モデルを考え、そのモデルの妥当性や結果に対する影響度を知るためのツールの開発研究である。データによっては、大幅に"欠測がランダム"であるという前提から乖離しているものもあると思われ、その際にはこのようなモデル化が不可欠である。不完全データの処理問題は、分野を問わず、分析を行う際には必ずといっていいほど生じる重要な課題である。このような不完全データの処理について有効な方法が提示されれば、様々な分野におけるデータ分析おいて、これまで捨てられていたような不完全な情報の有効活用ができるようになる。現在のところ、"欠測がランダム"ではないと完全にいいきれる場合において、欠測メカニズムの探索やモデル化に関する研究を行った。とくに、事前情報の有効活用として、ベイズ的手法の検討を行っている。また、計算機に基づく手法を確立するために、情報科学分野での活用が多いデータマイニング手法による観測情報から欠測情報の補填についても検討した。また、潜在クラスモデルを拡張し、傾向スコアによる調整の代替法として有効であることを示した。 さらに数値評価のためのプログラムを作成した。これは、来年度以降に開発を予定しているソフトウェアでも有効活用できるものである。
|