2014 Fiscal Year Research-status Report
識別不可能な有限混合モデルの推定と要素密度の個数特定化のための検定統計量の開発
Project/Area Number |
26780137
|
Research Institution | Hiroshima International University |
Principal Investigator |
増原 宏明 広島国際大学, 医療経営学部, 講師 (10419153)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | 有限混合モデル / プロビットモデル / 識別性 |
Outline of Annual Research Achievements |
研究初年度は、2つの分布が加法型で混ざっている有限混合モデルにおいて、被説明変数が非連続変数のときの、識別不可能性を回避する問題を分析した。特に有限混合モデルでは、被説明変数が2値であると、仮に真のデータ発生課程が有限混合分布であっても、これを識別することができない。そこで2値の変数以外に、いかなる条件を付与すれば識別可能であるかを確かめた。 この証明は、3つのステップでなされた。第1に、先行研究と同様の積率母関数を用いる証明により、2変数の有限混合モデルの識別可能性に関する補題を証明した。そこでは、2つの変数のいずれかの変数の性質が、識別可能に影響を及ぼすことが示された。第2に、この補題を用いて、2値変数同士の同時方程式モデルを考察した。この場合は、2値変数が1つのみのときと同様に、識別不可能であることが示された。第3に、先ほどの補題を用いて、2値変数と連続変数の同時方程式モデルを検証した。積率母関数に代数計算ができない積分が含まれるが、ガウス型の積分公式を用いることでこれを計算でき、その結果識別可能となることが導かれた。またこの場合、連続変数は2値変数と相関があっても、無相関でも識別性に影響は無いことも明らかとなった。 応用経済学で用いられるミクロデータでは、2値の被説明変数だけしか存在するわけではなく、これと相関を持ったり、無相関の連続変数の被説明変数の候補が存在する。このような場合には、本研究の成果により、2値の被説明変数が有限混合分布であっても推定可能となることを意味し、現実のデータの分析可能性が増したといえる。 上記の証明結果を、モンテカルロ・シミュレーションで確認したところ、連続変数を正規分布として、2個の要素密度において標準偏差パラメーターのみを変え、平均値パラメーターを同一にするという比較的厳しい条件においても、識別可能であることが確認された。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
研究初年度は、研究目的に掲げた有限混合モデルにおける、被説明変数が非連続変数のときの識別不可能性を回避する統計モデルの開発については、おおむね分析できた。 研究実施計画に記載したとおりに、先行研究と類似した証明方法により、まず2変数の有限混合モデルの識別可能性の条件を証明し、補題を導いた。次にこの補題を用いて、2値変数と2値変数の同時方程式モデルにおいては、識別不可能であることを導いた。最後に先ほどの補題から、2値変数と連続変数の同時方程式モデルを考え、ガウス型の積分公式を用いることで、識別可能となることを導いた。さらに、厳しい条件の下での、モンテカルロ・シミュレーションでも識別可能性が確認され、分析結果が頑健であることが示された。 以上のように、研究目的と研究計画に掲げたものをおおむねクリアしており、また予定していたやり方に則り、計画通りに研究を進めることができた。研究成果も今年度内に観光されており、進捗状況は順調と結論付けることができる。
|
Strategy for Future Research Activity |
研究2年目は、当初の計画通り、有限混合モデルにおける要素密度の個数を特定化するための、検定統計量を開発する。有限混合モデルにおいては、有限の要素密度で推定するので、要素密度を足すことでいくらでも尤度が近似でき、過剰識別が生じやすい。これにより、尤度が際限なく増加するために、モデル選択において頻繁に使用する尤度比検定を適用することができない。 そこで、この問題を回避するための方法を研究2年目に実施する。具体的には、Vuongの非入れ子型の検定統計量を用いて、要素密度の個数特定化を試みる。そこでは当然のことながら、先に議論した過剰識別を回避する必要がある。そこで、推定された尤度が正しくないという前提の下、尤度を近似する複数の方法を試す。具体的には、ラプラス近似、classification likelihood、これら2つの折衷案、さらに分布の重なりを調整する方法である。これら4つを探索的に試し、どの方法がもっとも真の尤度を近似することができ、検定統計量として機能するかを検証する。
|
Research Products
(1 results)