研究課題/領域番号 |
20K14360
|
研究機関 | 大阪大学 |
研究代表者 |
佐藤 倫治 大阪大学, 医学系研究科, 特任助教(常勤) (80865220)
|
研究期間 (年度) |
2020-04-01 – 2023-03-31
|
キーワード | 一般化推定方程式 / 平均構造 / 漸近性質 |
研究実績の概要 |
本研究は、臨床研究や疫学研究で多く取り扱われる繰り返し測定データの予測モデルの構築に焦点を当て、予測精度を向上するようなモデル選択規準の提案を目的としている。予測精度向上のためのモデル選択は、疾患の早期発見や予防のための指標の作成などに有用であると考える。また、一般化推定方程式の提案された Liang and Zeger (1986) の論文をはじめとして、多くの論文の中で「真の平均構造は正しく特定できている」という仮定の下で漸近性質やモデル選択規準が導出されていたものの、実データにおいては真の平均構造はわからず適切なモデリングが難しい状況もある。さらに、一般化推定方程式における平均構造の誤特定の影響に関しては報告がない。そこで、平均構造のモデリングに関しても柔軟なモデル選択規準の導出も重要である。 本年度は以下の2点を中心に研究を遂行した。 1) 本年度に公表された Sato and Inatsu (2020) および Sato (2020) の結果を利用して、データの相関構造が未知の場合における一般化推定方程式のモデル選択規準に焦点を当てた検討を行った。具体的には、Sato and Inatsu (2020) および Sato(2020) で提案された規準を自殺死亡に関する観察研究で実際に得られたデータと人口動態統計と国勢調査データに適用し、モデル選択規準の実行可能性と有用性を評価しており、その結果については関連する学会で報告する準備を進めている。 2) 2値データ解析における平均構造の誤特定の影響に関する報告 (Czado, 1992) を基に、一般化線形モデルの枠組みにおける平均構造の誤特定の影響を、一般化推定方程式の枠組みに応用することで、解析に与える影響を評価する方法論の導出に着手しており、その結果をまとめ次第、論文発表や学会発表を行う予定である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
本研究の当初の計画では、以下の5つのステップに従って研究を遂行する予定であった。 ①平均構造を誤特定したときの一般化推定方程式から得られる推定量の漸近性質の確立 ②モデル選択規準の導出 ③モデル選択規準の漸近理論の確立 ④モデル選択規準の数値シミュレーション ⑤モデル選択規準の実データへの適用。 ①に関して、現状 Czado (1992) を基に2値データの場合の平均構造の誤特定の影響を評価しているが、一般的な分布に対する結果が得られていない。当初の計画では一般的な分布においての誤特定の影響を評価する予定だったため、「やや遅れている」とした。一般的な定式化はできていないものの、特定の分布に対して平均構造の誤特定の影響を評価できれば、特定の分布に関する研究として②以降にステップアップすることができる。 また、本年度は新型コロナウイルスのパンデミックにより、当初予定していた学会などに参加できず、成果の公表や関連分野の研究者との意見交換もできなかったことも進捗がやや遅れている理由としてあげられる。
|
今後の研究の推進方策 |
本研究の計画当初の5つのステップのうち、①に関して解決できていないその他の分布について研究を進める。まず2値データやカウントデータにおけるリンク関数の誤特定の問題から着手し、その後連続データや一般的な観測値に対する評価を行う。一般的な分布における定式化ができたのちステップ②に移行し、モデル選択規準を導出する。その後導出したモデル選択規準の漸近性質を数理的に示し、数値シミュレーションにより挙動を確認する。得られた結果は関連学会で発表し、国内外の研究者の意見を踏まえて、より良い方法論の開発へと進めていく。さらに、ステップ⑤では、臨床研究や疫学研究の専門家と意見交換をしつつ、導出したモデル選択規準を用いた解析結果と、臨床データや疫学データの構造を比較検討し、より洗練された統計モデルの構築をするとともに、現実的な仮定を基にした方法論の開発に取り組む。
|
次年度使用額が生じた理由 |
本年度では、新型コロナウイルスのパンデミックにより、当初予定をしていた学会への参加が困難となり、すべてWeb開催となったことや、当初予定をしていた物品の購入に関しても流通の問題からいくつか購入することができないものがあったことにより、次年度使用額が生じた。 次年度においては、当初購入予定であった書籍やパーソナルコンピュータの購入を検討している。パーソナルコンピュータに関しては、実データの解析の際に個人情報保護の観点からスタンドアローンのものを用意する必要があること、さらに大規模なデータをもとに探索的な分析を予定しているため、高性能なものが必要となる予定である。
|