2021 Fiscal Year Annual Research Report
Spatio-temporal risk models for Hiroshima and Nagasaki exposures by Fused-lasso
Project/Area Number |
20H04151
|
Allocation Type | Single-year Grants |
Research Institution | Radiation Effects Research Foundation |
Principal Investigator |
山村 麻理子 公益財団法人放射線影響研究所, 統計部, 研究員 (60525343)
|
Co-Investigator(Kenkyū-buntansha) |
坂田 律 公益財団法人放射線影響研究所, 広島疫学部, 副部長 (60258423)
柳原 宏和 広島大学, 先進理工系科学研究科(理), 教授 (70342615)
小田 凌也 広島大学, 情報科学部, 特任助教 (10853682)
大石 峰暉 広島大学, AI・データイノベーション教育研究センター, 特任助教 (00878291)
福井 敬祐 広島大学, 先進理工系科学研究科(理), 准教授 (50760922)
|
Project Period (FY) |
2020-04-01 – 2025-03-31
|
Keywords | 時空間統計解析 / fused-lasso / スパース推定 / 情報量規準 |
Outline of Annual Research Achievements |
研究の2年目,令和3年度はコロナの影響が続き,在宅での研究やオンラインの学会が多い1年であった. 13th International KES Conferenceというオンライン国際会議において,Spatial Data Analysis and Sparse Estimationというセッションの議長を務め,fused-lassoを用いたモデル,最適解を求める際に必要となる座標降下法や情報量規準,及び統計ソフトを用いた分析プログラムに関する研究を発表した.これらは我々が取り組む時空間統計解析モデルの作成において必要となる統計学の研究である.有識者からの助言により研究の修正点や課題などが見つかり,fused-lassoの推定精度を向上させることができた.また,スパース推定全体を通したデータへの応用技術を学ぶことで,研究の発展に繋がった.fused-lassoには多くのlassoの仲間があり,スパース推定とはこれらを総称したものである.その他に統計関連学会連合大会など計12件の発表を行い,雑誌論文は本研究に直接的または間接的に関わるものを合わせて計13件作成した. 本研究は,教科書となる専門書籍よりも内容が複雑である.そこで研究内容をいかに分かりやすく説明するかに尽力した.具体的には,開発した統計手法を正しく,美しい数式で表し,分かりやすい発表に努めた.さらに,分析用のプログラムを統計ソフトのRで作成し,入手したデータを分析できるように加工し,得られた分析結果を視覚的に分かりやすく,美しく示す技術の向上に努めた.これらは寿命調査のデータを分析する際に必要となる技術である.研究が積み重ねられていく過程において,数式やプログラムを正しく,美しく作成することは,後に続く研究発展への貢献となり重要である.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
本研究の目的は,fused-lassoを用いた時空間統計解析モデルを作成し,広島・長崎の被爆者の死亡やガン罹患のリスクに関する地理的差異を考察することである.そこで,放射線影響研究所が管理する被爆者の情報が含まれた寿命調査(LSS)という個票データの使用を予定している.データの使用には当然,倫理的な配慮が必要で,放射線影響研究所と倫理審査委員会に研究計画書を提出し,双方からの指示に従い,承諾を得ることで初めて使用が可能となる.令和3年度に承諾の取得を予定していたものの,達成できなかった.理由としては, 令和4年4月より施行のデータ利用に関する国の法律改正があった.放射線影響研究所や関連するデータの管理先での施行に向けた確認作業があり,混乱を避けて様子を伺うことが良いと判断した.寿命調査のデータ使用のための研究計画書を書くには,改正により新たに加わる規則を確認する必要がある.具体的には,使用できるデータの内容や範囲に新たな制限などはないか,使用許可を得るための書類として新たに追加されるものはないかなどが考えられ,状況によっては研究計画を変える必要がある.放射線影響研究所は原爆の犠牲となった被爆者のデータを厳重に管理している.研究所での対応の方向性が落ち着くことを第一とした. 一方で,モデルに関する理論的な研究は悪くない進捗状況であると思われる.Fused-lassoを用いた分析の統計理論においては,最適解を求める計算アルゴリズムを発展させ,GibHabというウェブページに公開した.さらに,統計学や数学の理論よりモデルを作成し,実データへの応用を始めると,想像できなかった問題が起こる.寿命調査を用いた時空間統計解析を想定した研究課題をみつけては,問題解決に繋がる研究に取り組むことができた.
|
Strategy for Future Research Activity |
令和3年度に達成できなかった寿命調査の個票データの使用承諾を得たいと思う.よって,データ使用に関する法律改正で変更した点を確認し,研究計画書を作成し,放射線影響研究所と倫理審査委員会へ提出する. 本研究にまつわる統計理論的な研究を引き続き行いつつ,これまでに習得した研究成果を用い,寿命調査への応用準備を始める.まずは,すでに始めている寿命調査の人年票データを用いたfused-lassoのモデルによる固形ガン罹患のリスク推定である.人年票は1958年から2009年に収集された寿命調査を,個人が特定できない集計データに加工したもので,公開研究データとして放射線影響研究所のホームページからダウンロードできる.公開研究データと呼ばれることからも,基となる研究が公開されており,我々のfused-lassoのモデルによる推定結果と公開研究の結果とを比較することで,fused-lassoの寿命調査への利用可能性を示すことができる.さらに,公開研究を超える研究成果も期待される.また,人年票であっても,個票データと同様の変数を含んでおり,これらの変数をモデルにどの様に使用するかを研究し,分析プログラムを作成し,実際に分析を行うことで,個票を扱う準備ができる上,データの理解を深めることができる.次に,広島と長崎の原爆放射線被爆によるガンの死亡や罹患のリスクを地理的に考察する為.ArcGISなどのGIS(地理情報システム)による分析技術を習得する. 研究集会を開く.統計理論の内容に加え,寿命調査を通して被爆者データを紹介する.広島と長崎の被爆者データは放射線医学・疫学・生物学の分野で知られるばかりで,広く人々に知られることがほぼない.本年度は戦後77年にあたり被爆者も減少し,残された寿命調査の収集期間も長くはない.研究集会を通じ,多くの人に本研究を知ってもらえる機会としたい.
|
Research Products
(25 results)