2012 Fiscal Year Research-status Report
無視不可能な欠測データの一般化モーメント法にもとづく解析方法の開発
Project/Area Number |
24700284
|
Research Institution | Kansai University |
Principal Investigator |
高井 啓二 関西大学, 商学部, 助教 (20572019)
|
Project Period (FY) |
2012-04-01 – 2014-03-31
|
Keywords | 欠測値 / 多変量解析 / 無視不可能な欠測 / 推定関数 |
Research Abstract |
本年度は,欠測データ解析の枠組みを用いた半教師あり学習の開発及びモーメント法による欠測データ解析の枠組みについての研究を行った.半教師あり学習とは,一部のデータには所属グループを示すラベルがついているが,もう一方のデータにはラベルがついていないデータから,判別のルールを構成するというものである.このデータについては,ラベルが特徴ベクトルの値に依存せずに生成される状況と,依存して生成される状況を考えた.また,ラベルがあるデータとラベルのないデータの両方を使うのか,ラベルのあるデータだけを使えばいいのかを誤判別率から判断する基準を理論的に導出した.この基準が実際にどのような挙動を示すのかを調べるために数値実験を行った.これらの研究成果をドイツの分類学会で発表した.研究の成果を論文としてまとめ,現在査読のある学術雑誌に投稿している. 後者については,モーメントに基づいて欠測メカニズムの検証を行うための手法,及び欠測メカニズムを誤特定したときにその影響を抑えるための手法を開発した.従来欠測値の解析は尤度に基づいて行われることが多かった.しかし,実際のデータではデータの確率分布を正確に指定できることはほとんどない.そこで,本研究では,確率分布を仮定せずに1次と2次のモーメント条件だけを仮定して回帰パラメタを一致推定できる方法を提唱した.この手法はMARの下でうまく働くことを証明した.しかし,MARかどうかはわからないことが多いので,データがMARかどうかを検定する方法を提唱した.もし,この検定でMAR性が否定されていてもパラメタをできるだけバイアスが少ないように推定できるようにバイアスを減少させる変数の条件を求めた.これらの成果は,日本で行われた国際学会で発表し,論文としてまとめたものを投稿中である.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本年度の計画は,(1)単調な欠測におけるモーメント推定,(2)非単調な欠測におけるモーメント推定,(3)GMMへの拡張,を行うことであった.様々な計算を行った結果,モーメント推定を包含する推定関数の理論を用いた方が,理論的に扱いやすく,かつ意味のある結果が出ることが分かった.そのため,推定関数の理論を用いた欠測データ解析を本年度は行った.その結果,単調であろうと非単調であろうと,どんな欠測データに対しても用いることのできる推定関数の理論を構築することができた.これは,尤度関数及び,モーメント推定を含む形での理論展開ができるということである.従って,本研究は,当初の計画とは異なるが,おおむね順調に推移しているということができる.これらの結果については,現在更に計算を続け,論文としてまとめる予定である.
|
Strategy for Future Research Activity |
今後は,本年度に得た結果をもとに更に理論を展開していく.本年度は推定関数にもとづく欠測の理論の端緒を開いた.従来の計画では,一部のパラメタを推定する方法についていろいろな多変量解析の手法別に研究する予定であった.しかし,様々な推定方法を含む推定関数に基づけば,従来の計画のように手法別に研究を行う必要はほとんどなくなった.従って,本年度は,推定関数に基づいた理論を深化させていく.ただし,この推定関数の理論は主として,いわゆる無視可能な欠測の場合にだけ使用することができた.本年度は,無視不可能な欠測にも適用できるように拡張を行う.これには計量経済で使用されてきた,操作変数法の考え方の拡張が有効であるとの感触を得ている.本研究の応用として,半教師あり判別分析だけでなく,測定誤差を含む変数や潜在変数を含むモデルを考えている.推定関数の理論は,直ちにパラメタの数値計算の方法として利用できるため,モーメント条件のみを用いて分布を仮定しないEMアルゴリズムを作ることもできると期待できる.また,これらの研究結果は,できるだけ,論文や学会発表という形で発表していくことを予定している.
|
Expenditure Plans for the Next FY Research Funding |
本年度は,研究結果の出る時期が遅かったため,予定していた海外での発表を行うことができず,次年度への繰越金が生じた.次年度は,第一に,本年度に得た結果を発表し,情報を収集するために研究費を利用する.現時点で,カナダで行われる国際会議Joint Statistical Meetingでの発表がアクセプトされている.他にも海外で行われる複数の統計関連学会での情報収集のために研究費を使う予定である.また日本国内での,統計関連学会での発表も行う予定である.また他の国際会議においても発表を行う予定である.第二に,これらの学会での意見を参考にして結果を論文としてまとめて,投稿するが,その際の英文校閲にも研究費を利用する予定である.第三には,ここまで得られた結果を更に発展させていく必要がある.そのために書籍および,シミュレーション用のコンピュータを購入するために,研究費を利用する.欠測は上で述べたように様々な分野との関わりがある.そのため,関連分野の書籍等を購入する必要があろう.欠測データ解析のための手法を開発するに当たっては,解析的に式展開を追えない場合が,頻繁に出てくる.その際,シミュレーションが必要となるので,演算能力の高いコンピュータを購入する予定である.
|