研究課題/領域番号 |
21K13274
|
研究機関 | 関西学院大学 |
研究代表者 |
國濱 剛 関西学院大学, 経済学部, 准教授 (40779716)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
キーワード | ベイズ統計学 |
研究実績の概要 |
本年度の研究では,死因とその予測に用いる説明変数の同時確率分布の構築に主に取り組んだ.死因の聞き取り調査の質問項目から構成される説明変数には多数の欠損が含まれており,標準的なアプローチでは欠損値の補完が必要になるが,高次元な多変量変数における欠損値補完は容易ではないことが知られている.そこで,分析が複雑となることが予想される補完を避けるため,説明変数を使って死因を直接的に統計モデルで表現するのではなく,死因毎に変化するような説明変数の条件付き分布を開発することに取り組んだ.また,説明変数には様々な症状の有無・病歴に加え,性別や年齢などの個人的性質も情報として含まれるが,前者と後者は概念的に異質なものと考えられるため説明変数を大きく2つに分けて,後者が前者に影響を与えるような統計モデリングを行った.加えて,同じ質問票を用いても調査の実施場所が異なれば死因と説明変数の関係性も変化する可能性があるため,その点を考慮に入れた階層的構造の開発にも取り組んだ.これらの提案する新しい統計モデルのパラメータ推定を行うために,マルコフ連鎖モンテカルロ法に基づく計算アルゴリズムの開発を行った.現在に至るまで,PHMRC(Population Health Metrics Research Consortium)データなど,口頭剖検のために利用可能な実際の聞き取り調査データを用いて従来の手法との比較に取り組んでいる.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
死因の予測分析に用いるすべての変数に対して確率モデルを作成し,その同時分布に基づいて説明変数の重要性を測るアプローチを採用するため,現在まで聞き取り調査データの特徴を柔軟に捉えることのできるベイズ統計モデルの開発に取り組んでいる.当初,説明変数の混合尺度を表す方法を模索したが,簡易的な2値尺度を用いる既存手法との試験的な比較において大きな違いが見られなかったことに加え,関連文献において年齢などの人口学的情報と症状・病歴などの他の説明変数との異質性が指摘されたことを考慮して,2値尺度データを用いた人口学的変数のモデル化を進めている.同様に,複数の先行研究において調査の実施場所により変数の関係性が変化する可能性が報告されており,この点についても提案する統計手法の枠組みの中で検証するため,調査場所情報を新たな説明変数として取り入れて分析を進めている.
|
今後の研究の推進方策 |
死因情報が与えられた下での説明変数の条件付き分布を新たに開発していくが,変数の次元が高く標準的手法で相関関係を記述するのが困難であるため,因子モデリングを応用することでパラメータの次元を低く抑える.この因子と年齢等の人口学的変数を組み合わせることで,症状・病歴の相関構造が人口学的変数に依存して変化するようなモデル化を進めていく.地理的情報に関しては,調査場所と紐付けする確率分布をそれぞれすべて同一または全く別物と仮定するのでなく,情報が一部共有される階層的構造を構築することを目指す.さらに,上記の人口学的変数の影響もこの階層に組み込むような拡張を考えていく.提案する新しい統計モデルに対してはパラメータ推定を行うためのマルコフ連鎖モンテカルロ法に基づく計算アルゴリズムの開発を並行して行う.また,PHMRCデータを用いた複数のシナリオの下で,考案した統計手法と既存のアプローチとの比較を行い,データへの当てはまりがどの程度向上するのかを明らかにする.得られた研究成果は積極的に研究学会などで発表を行うことを目指す.
|
次年度使用額が生じた理由 |
購入予定の計算機器などの物品を翌年度に変更したため未使用額が生じた.翌年度に必要となる物品の購入費用や旅費として利用する.
|