2015 Fiscal Year Research-status Report
識別不可能な有限混合モデルの推定と要素密度の個数特定化のための検定統計量の開発
Project/Area Number |
26780137
|
Research Institution | Hiroshima International University |
Principal Investigator |
増原 宏明 広島国際大学, 医療経営学部, 准教授 (10419153)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | 有限混合モデル / 要素密度 / 検定統計量 |
Outline of Annual Research Achievements |
研究2年目は、有限混合モデルにおける要素密度の個数を特定化するための、検定統計量を開発した。有限混合モデルにおいては、要素密度を足すことでいくらでも密度の近似の程度が上がり、過剰識別が生じやすい。尤度が際限なく増加するために、モデル選択において使用される尤度比検定を適用することができない。 そこで、Vuongの非入れ子型の検定統計量を用いて、要素密度の個数特定化を検証した。推定された尤度が正しくないという前提の下、尤度を近似する複数の方法を試した。具体的には、ラプラス近似、識別尤度(classification likelihood)、これら2つの折衷案の統合識別尤度である。ラプラス近似とは、分散共分散行列の推定量である情報行列を用いて尤度を補正する試みで、誤った定式化の場合はペナルティが大きくなることを利用している。識別尤度とは、尤度を期待完全尤度のみで評価する方法である。真の尤度は、要素密度の個数が増加するにつれて罰則を受けることを利用し、この識別できない部分を差し引いて、識別できる部分のみを用いる方法である。 モンテカルロ・シミュレーションの結果、以下の結論を得た。通常の尤度では、尤度が過大になるため有限混合モデルの個数が大きいものを採択しやすく、逆に識別尤度、統合識別尤度では尤度を過少に評価することから、有限混合モデルの個数が小さいものを採択しやすいことが認められた。すなわち、通常の尤度、識別尤度、統合識別尤度からは、有限混合モデルの個数を決定することはできなかった。しかしながら、ラプラス近似を用いたVuong検定であれば、真の定式化が未知であっても、サンプルサイズが大きくなれば検出力が高くなり、第1種過誤も小さい傾向を有していた。すなわち、ラプラス近似を用いた検定であれば、真の定式化を統計的に決定できる可能性があると結論付けることができた。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
研究2年目は、研究目的に掲げた、有限混合モデルにおける要素密度の個数を特定化するための検定統計量の開発については、おおむね分析できた。 研究実施計画に記載したとおりに、Vuongの非入れ子型の検定統計量を用い、尤度を近似する複数の方法(ラプラス近似、識別尤度、統合識別尤度要素密度)で、個数特定化を試みることができた。また、モンテカルロ・シミュレーションにより、ラプラス近似を用いたVuong検定であれば、真の定式化が未知であっても、サンプルサイズが大きくなれば検出力が高くなり、第1種過誤も小さい傾向を有していたことが明らかとなった。 以上のように、研究目的と研究計画に掲げたものをおおむねクリアしており、また予定していた方法論に則り、計画通りに研究を進めることができ、研究結果も当初の期待通り満足のいくものであった。研究成果も今年度内に刊行されており、進捗状況はおおむね順調に進展していると結論付けることができる。ただし、尤度の近似方法として、研究計画書に記した分布の重なりを利用したものについては、結果を報告できなかった。もちろん今回の結果で、研究目的に記載した要素密度の個数を特定化することについてはクリアできるが、分布の重なりを利用する方法がラプラス近似よりもパフォーマンスとして上回るかどうかは未知である。もしパフォーマンスに優れるものとなるならば、より精度の高い検定が可能となるので、これについては3年目にすべき課題としたい。
|
Strategy for Future Research Activity |
研究最終年度は、2年目で未達成であった、有限混合モデルにおける要素密度の個数特定化のための検定統計量として、分布の重なりを利用した尤度の近似方法をまず試したい。2年目でラプラス近似の有用性が示されたが、分布の重なりを考慮したものはラプラス近似を凌駕するかについては、未知である。分布の重なりをどのように表現すべきであるのか課題が残っているが、これを解決したものを提案し、モンテカルロ・シミュレーションによりそのパフォーマンスをまず確かめたい。結果が良好でなかった場合も想定されるので、この課題と同時並行して、当初の予定である以下の課題を実施する予定である。 すなわち研究最終年度は、(1) 2 値の横断面データのFM モデルにより、(2) そのモデルの要素密度の個数を決定し、現実のデータではいかなる結果になるのかを検証する。使用するデータは、データの一般性を考慮して、東京大学社会科学研究所が提供している日本版総合社会調査(大阪商業大学、JapaneseGeneral Social Survey、JGSS)、もしくは老研-ミシガン大全国高齢者パネル調査(東京都老人総合研究所、ミシガン大学)である。ただし、要素密度の個数が1 になってしまっては、大きなインパクトは認めれない。そこで、複数のデータセットを試しながら、2 以上の結果が出たもので、また政策的含意がわかりやすいものを論文としてまとめる予定である。
|
Research Products
(2 results)