研究課題/領域番号 |
23700347
|
研究機関 | 統計数理研究所 |
研究代表者 |
小森 理 統計数理研究所, 統計思考院, 研究員 (60586379)
|
研究期間 (年度) |
2011-04-28 – 2013-03-31
|
キーワード | データベース構築 / 統計手法構築 |
研究概要 |
本研究は南極観測隊員の越冬中の健診データに対するデータベース構築と,その後のデータ解析を目的に始まった.昨年度中にデータ整備を完了する予定であったが健診データがもつ特殊性(個人情報の取り扱いの難しさと,古いデータの追跡可能性の問題)のため,データ収集整備が思うようにはかどらなかったのが現状である.ただ今年度に入りようやくデータ収集のめどが立ち,本格的なデータ整備に取り組めるような体制が整ってきた.昨年度は本研究の2年目に行う予定であったデータ解析(統計的解析方法)に重点を置くとともに,健診データの臨床的意義の調査を主に行った.詳細は統計数理研究所の共同研究リポートとしてまとめた. 今年度実際に行ったことは越冬中の隊員の病気予測(2値判別問題)の統計モデルの確立と,その手法の提案である.通常判別問題では2つの母集団を仮定する.健常者の集まりで集団に同質性の仮定ができる健常群と,病気になった集団(病気の原因は種主雑多であり,かなりの異質性があると仮定される)である.通常の判別解析では上記の集団の同質性と異質性を考慮せずに行われている(Fisher判別,ロジスティック関数を用いた一般化線形モデルなど).そこでこれらの性質を考慮した統計手法を提案し,線形判別の中では一番判別精度がよく,しかも判別関数の係数の漸近分散が最小となる手法を構築した(ただし確率分布に対していくつかの仮定が必要).この成果は今論文としてまとめている最中である.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
前述のように,個人情報保護の観点より南極観測隊員の健診データの入手に遅れが生じ,データベースの作業が難航している.ただそれ以外のデータ(過去50年分の観測隊員の所属情報,または越冬中の気象情報等の整備は着実に進行している)の整備は予定通りに進んでいる.本研究の2年目に予定されていた統計解析(統計手法の提案)に先に取り組むことで,全体的な研究の進捗状況はそれほど遅れないように調整した.ただ実際の健診データの解析は今年度から開始なので,申請期間(2年間)でこの研究が終了できるかどうかは未定.今後の進捗状況によっては1年間の延長を申請することも考えている.
|
今後の研究の推進方策 |
健診データの整備解析がメイン.健診データの臨床的意義の考察,また用いる統計手法の構築はほぼ済んでいるので,データの整備が終了すれば,その後の解析はスムーズに行える見通しである.また観測隊員の病気の予測以外にも,今回の健診データの利用方法はいろいろと考えられる.極地での生活が人体に与える影響はこれまでほとんど調べられておらず,今回の過去50年分の観測隊の健診データと,既存の日本全国の健診データの比較をすることで,観測隊員に固有な健康状態の変異を捉えることができる思われる.それらを詳細に解析することで今後の観測隊員の健康維持,管理,向上に貢献していきたい.
|
次年度の研究費の使用計画 |
膨大なデータ入力,整備を行っていただくスタッフへの謝金が主な使い道となる.またそれに伴うソフトウェアも随時購入する予定である.
|