経時的な要因でがんリスクに影響を与えているのは、年齢・時代・生まれ年の3つであることが知られている。しかし、これら3つの要素には「生まれ年+年齢=時代」という線形従属な関連性から各要素を分解することができず、この問題は「APCモデルにおける識別問題」として知られている。そこで、本研究においては、この3要素のうち最も特定が困難とされる「生まれ年」効果について、統計学的アプローチにより自動的な検出法を確率することを目的とした。 基本モデルは人口をオフセットとしたポアソン回帰モデルにおいて説明変数を年齢と時代およびそれらの交互作用によって構築し、生まれ年効果はガウス基底として設定してモデルに組み込むことにより識別問題の回避を試みた。このようなアプローチは数理モデルに基づいており、必然的に生まれ年効果が「自動で」検出されることになる。この点に関しては、解析者のバイアスが混入しないというメリットが存在する一方で、既存の知見が活用できないというデメリットも存在する。 がん死亡に関しては生まれ年効果に関して、既存の疫学研究における知見とも一致するような鋭敏な結果が得られた。その一因としてはデータの完全性および質の高さにあるとも考えられる。一方で罹患に関しては主要な知見に関しては生まれ年効果に関する結果を再現できたが、そこまで鋭敏な結果ではなかった。これはがん登録の完全性といったデータ由来の問題点に由来するものと考えられる。
|