小学生を対象に毎年実施して得た身体測定データのように,複数の対象に継続的に測定をして得たデータを縦断データと呼ぶ。縦断データでは,例えば成長に伴って身長がどのように変化するのかといった変化のパタンにしばしば興味がもたれる。そして,縦断データに見られる変化のパタンの個人差が個人のどのようなプロフィール(例えば,性別や年齢,パーソナリティ)により説明できるのかを調べる上でSEMTrees(構造方程式モデル決定木)と呼ばれる方法が近年注目されている。SEMTreesでは,変数間の関係を記述する構造方程式モデル(テンプレートモデル)を立て,そのモデル内の母数の違いを基準にデータを順々に分割(partitioning)していく。 本研究課題はSEMTreesについて,主に,(1)スーパーコンピュータを用いた大規模シミュレーションに基づくSEMTreesの性能評価研究,(2)SEMTreesの実行の高速化研究,(3)大規模縦断データを用いたSEMTreesの応用研究,(4)テンプレートモデルの設定の違いと正確な分類に必要なサンプルサイズや分類結果に与える影響の関係についての基礎的研究,の4点から検証を行った。(1)については,他の既存の分類手法との性能比較およびモデルの誤設定の影響を踏まえて大規模なシミュレーションを実施し,その成果をまとめ現在海外誌に投稿中である。(2)については,推定の高速化とともに、新たな分類基準に基づくSEMTreesの分析プログラムを開発し,(3)の縦断データへの適用事例とともに,その概要を解説した論文を執筆中である。(4)に関しては,有限混合モデルにおけるモデル設定とクラス数推定の関係,サンプルサイズ決定方法,および様々な縦断データ分析モデル間の同値条件,などの基礎研究を進めた。これらの成果の一部は既に海外誌に掲載されており,その他は現在投稿中である。
|