2022 Fiscal Year Annual Research Report
Spatio-temporal risk models for Hiroshima and Nagasaki exposures by Fused-lasso
Project/Area Number |
20H04151
|
Allocation Type | Single-year Grants |
Research Institution | Radiation Effects Research Foundation |
Principal Investigator |
山村 麻理子 公益財団法人放射線影響研究所, 統計部, 研究員 (60525343)
|
Co-Investigator(Kenkyū-buntansha) |
坂田 律 公益財団法人放射線影響研究所, 広島疫学部, 副部長 (60258423)
柳原 宏和 広島大学, 先進理工系科学研究科(理), 教授 (70342615)
小田 凌也 広島大学, 先進理工系科学研究科(理), 助教 (10853682)
大石 峰暉 東北大学, データ駆動科学・AI教育研究 センター, 助教 (00878291)
福井 敬祐 関西大学, 社会安全学部, 准教授 (50760922)
|
Project Period (FY) |
2020-04-01 – 2025-03-31
|
Keywords | Fused Lasso / スパース推定 / 時空間統計解析 / 情報量規準 / 地理情報システム |
Outline of Annual Research Achievements |
本研究では,広島・長崎の原爆放射線被爆のリスク分析を行うための時空間統計解析モデルを作成している.当該年度においては,それまでに蓄積した知識を集約し,ロジスティック回帰分析とポアソン回帰分析についてモデルを作成し,推定アルゴリズムを提示した上,データ分析のためのプログラムの作成を行った.またこれらのモデルを用いてデータ分析を行う際には,いくつかの候補のモデルの中から最もよいモデルを選ぶモデル選択という統計手法が不可欠であり,その手法の1つであるマローのCp基準についての研究を行った.研究成果については,論文を作成し,学会や研究会にて発表を行った. 時空間統計解析モデルを実データに応用した際に,時空間の分析結果を視覚化する必要がある.近年,地理情報システム(GIS)の発展により,視覚化の技術が進み,標高を含んだ3D地図上に時空間統計解析結果を視覚化できるようになった.標高については,例えば山の裏側などはシェルターとして原爆被害を弱める影響があったことから,3D地図データを用いた被爆リスク分析結果の視覚化は大変有意義であると考えている.よって,GISを本研究で使用するため,地理分析ソフトであるArcGISの使用について重点的に学び,使用するためのスキルを身に着け,現在も講習会や研究会に参加してスキルアップを図っている. 3月には原爆被爆リスクや医療データを分析した統計学の応用研究や,fused Lassoやモデル選択に関連する研究など,本研究にまつわる有識者との研究集会を開催した.会場は広島大学を利用し,準備は広島大学に所属する分担研究者が中心となって担当した.研究集会では活発な議論が交わされ,また研究集会後も研究の先を見据えたさらなる研究の発展や,広島大学での被爆リスクの分析の状況等について情報交換を行った.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
本研究では,時空間統計解析の理論的な開発を行い,実データに応用している.大きく分けて次の5つの課題について知識を収集し,研究を進める必要があると考えた.1つ目は時空間統計解析データの作成である.Fused Lassoでモデルを作成し分析を行う際には,空間の位置について,どの位置とどの位置が隣り合わせであるかといった情報が必要である.この情報を取り出すプログラム作成やArcGISなどの地理分析ソフトによる作業が必要である.これに関しては適宜作業を行っている.2つ目は時空間統計解析モデルの作成である.寿命調査データの分析は被爆者の死亡やガン罹患を扱うことから,死亡や罹患に関する比率またはイベント発生の分析に用いるロジスティック回帰分析,ポアソン回帰分析,生存時間分析に着目してモデルを作成している.前者の2つの分析は,ほぼ終了している.次の目標としては,放射線疫学分野で放射線容量反応モデルが提案されており,それをポアソン回帰分析に組み込むことで寿命調査に適した分析モデルを提案することである.3つ目は作成した時空間統計解析モデルの推定アルゴリズムの提案とプログラムの作成である.これは時空間統計解析モデルを提案するのと同時に行っている.4つ目は最適解を求める情報量規準の開発と研究である.Fused Lassoのモデルにおいて,推定の一部は情報量規準に頼ることになる.よって情報量規準の研究が必須であり,現在進行中である.5つ目は地理分析ソフトや統計ソフトによる推定結果の表示と地理情報システムへの応用である.これについては,「研究実績の概要」で述べた通りである. 研究の進め方や段階に問題はない.しかし,モデルの作成で生存時間分析に取り掛かれないことから,やや遅れていると判断する.
|
Strategy for Future Research Activity |
今後はこれまでの研究成果より得られたノウハウを用い,完成しているポアソン回帰分析の時空間統計解析を人年表ベースの寿命調査に応用する.人年表ベースでの寿命調査の分析は古く,過剰相対リスク(ERR)モデルや,過剰絶対リスク(EAR)モデルがあり,死亡や罹患への放射線の影響を明らかにするモデルとして広く知られている.これらのモデルは放射線疫学における放射線容量反応のモデルが基となり作成され,その設定には疫学的な意味合いが含まれる.しかしよく見ると,同じ変量が形を変えて2回加わっているケースなども見受けられ,推定結果の解釈が容易であるとは言い難い.そこで本研究では,ERR・EARモデルの疫学的な設定や意味合いは残すものの,fused Lassoのモデルに変更することで,推定結果の解釈を容易にすることを試みたい.また,本研究は次に続く研究として,生存時間分析の時空間統計解析モデルの作成を見据えての研究となる.時空間生存時間分析では,個票ベースの寿命調査の利用を考えている.この際も,放射線容量反応のモデルを生存時間分析に組み入れる必要がある.人年表ベースの寿命調査の分析は先行研究も多く安定している一方で,個票ベースの研究例は少ない.そこで,まずは人年表ベースのデータでERR・EARモデルをfused Lassoで作成し,放射線疫学の専門家から意見を伺い,研究を十分に重ねた上で,個票による生存時間分析の研究に応用することがよいと思われる.これに並行して,スパース推定,情報量規準,および生物統計学等の本研究に必要な研究題目を昨年と同様に進めることでスキルアップを図り,総合的にfused LassoによるERR・EARモデルを完成させていく.研究成果は雑誌に投稿し,研究発表を行う.
|