2022 Fiscal Year Research-status Report
購買履歴データと健康情報の融合による疫学的消費行動モデルの構築
Project/Area Number |
21K18227
|
Research Institution | The University of Tokyo |
Principal Investigator |
中谷 朋昭 東京大学, 大学院農学生命科学研究科(農学部), 准教授 (60280864)
|
Co-Investigator(Kenkyū-buntansha) |
阿部 貴行 横浜市立大学, データサイエンス学部, 准教授 (10594856)
田栗 正隆 東京医科大学, 医学部, 主任教授 (20587589)
上田 雅夫 横浜市立大学, データサイエンス学部, 教授 (20755087)
小泉 和之 順天堂大学, 健康データサイエンス学部開設準備室, 特任准教授 (70548148)
岩崎 学 統計数理研究所, 統計思考院, 特任教授 (40255948)
坂巻 顕太郎 横浜市立大学, データサイエンス推進センター, 特任准教授 (30644819)
|
Project Period (FY) |
2021-07-09 – 2024-03-31
|
Keywords | 購買履歴データ / 食物摂取頻度調査 / 購買チャネル / 栄養素摂取状況 |
Outline of Annual Research Achievements |
本研究は、食料政策や生活習慣病予防策の立案に必要なエビデンスを提供するために、これまで、複数の研究分野それぞれ独自に研究されてきた個人の生活様式とヘルスアウトカムとの関係に関する研究を、社会科学、自然科学および統計科学を活用して統一的に解明するモデル構築を目指すものである。これと併せて、関連する新しい統計解析手法の開発やその応用を実施することとしている。 本研究の特徴である購買履歴データと健康情報データとの融合については、体格指数(BMI)あるいは食物摂取頻度調査から推計された栄養素摂取状況を健康情報データの代理変数として利用した。 購買履歴データと食物摂取頻度調査の結果を統合して分析するにあたって、購買履歴データのクラスター分析によって、食料品購入先の使い分けパターンが4種類に分類されることが明らかとなった。このパターン間で、栄養素や食物群の摂取量に差があるかどうかを統計的仮設検定したところ、有意な差は認められない結果となった。また、データの特徴を考慮した統計モデルによって、栄養素の摂取比率を被説明変数とし、個人属性や購買チャネルの利用割合などを説明変数として別角度から同様の分析を行った結果、食料品の購買チャネルと栄養素の摂取量の間には、統計的には有意な差が認められたものの、実質的には無視できるほどの大きさしか持たないことが明らかとなっている。 このような結果が得られた背景として、近年における食品提供事業者の健康に配慮した取り組みにより、コンビニエンスストアや外食を多く利用する場合と、家で食材を調理したものを食べる場合との差が無くなっていることが考えられる。 従来の研究では、購買チャネルと栄養素摂取の関係について相反する結果が提示されていたが、本研究のように顕示選好データから両者の関係を明らかにしたものは皆無であるため、新たな知見として評価できる。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
2022年度は、新たな購買履歴データの購入と第2回目の食物摂取頻度調査を実施した。個年度購入分とあわせて、購買履歴データは2019から2021年度までの3年度分が整備された。食物摂取頻度調査は、前年度対象者に再度実施したが、一部に回答者の脱落があり、サンプルサイズ確保のために新たな対象者を選定して、前年度と同数の回答を得た。 食物摂取頻度調査データは、調査会社による栄養素摂取記録への変換が必要とされる。調査時期と年度区分の関係から、実際に分析に供することができるのは昨年度実施分のみであるが、次年度早々には第2回調査の変換結果が得られる状態になっている。 しかし、購買履歴データに記録された個別商品名から内容量や含有物についての詳細情報を得る方策がなたいため、代替的な手法を構築する点については、初年度で明らかになったように有効な方策がなく、引き続き統計学的な方法による変換係数の構築について検討を続けている。購買履歴データそのものの取り扱いについては、調査会社の協力や分析担当者の習熟度増加により、スムースな取り扱いが可能になっている。 一方で、本研究において分析の中心になると考えていた既存の統計モデルは、研究参画者間の詳細な検討の結果、大幅な改良を要することが明らかになってきた。しかし改良の方向性は明確であることに加え、試行的モデルは良好な結果を示していることから、本研究の目的に照らしてより望ましいモデルへの修正は可能であると判断している。 これまでの成果は、複数の学術論文や学会報告として公表しているほか、すでに次年度以降の学会報告にもエントリーしている。以上のように、新たに整備したデータを統合した分析が進みつつあること、また、それに伴う新たな研究課題への取り組みも進んでいるなどの状況から、研究はおおむね順調に進展していると判断する。
|
Strategy for Future Research Activity |
2022年度までは、入手できるデータの関係から、クロスセクション分析に留まらざるを得なかった。次年度以降は、特定個人の複数時点における購買履歴と栄養素摂取のデータから構成されるパネルデータを構築できるので、個人の異質性やいわゆる内生性に対応した厳密な統計的手法に基づく研究を実施する。ただし、内生性に対応する分析手法は、主として線形モデルで発展しているものの、本研究で用いる非線形モデルでは十分に研究が進んでいるとは言えない。加えて、栄養素摂取比率のようなシェアデータの分析手法も、本研究の目的に沿うものは見当たらない。そこで、上述の点に対応可能な統計モデルの開発が求められる。 食物摂取頻度調査における回答者の脱落は、パネル調査特有の問題であり、脱落者が系統的な特徴を持っている場合、継続した回答者だけでパネルデータを構築して統計的推測を行うと、いわゆる「脱落バイアス」といわれる偏りが生じる。そのため、脱落に系統的な特徴があるかどうかを確認することも、次年度以降の重要な研究課題である。 以上の解析手法上の課題については、研究グループ内だけでなく、国内外の学会等での報告を通じて、統計学者や計量経済学者から広くコメントを求める予定である。 購買履歴データから栄養素の量を推定する作業は、依然として困難が伴う。しかし、これまでの研究期間の中で、食料品の購買情報とそこから得られる栄養素の量を結びつけようとしているベンチャー企業の存在を知るに至った。この取り組みは、本研究が目指す購買情報と健康情報との融合という点で特筆すべきものであることから、同企業にコンタクトを取り、その知見を学ぶとともに、状況によっては共同研究の申し出も視野に入れている。
|
Causes of Carryover |
新型コロナウイルス感染症の影響により、参加を予定していた国内外の学会が中止あるいはオンライン開催となったため、旅費を中心に次年度使用額が生じた。2023年度は、ほとんどの学会が対面あるいはハイブリッド形式での開催が見込まれることから、これらの学会での報告を積極的に行う財源とする予定である。また、状況に応じては、追加的に必要となるデータ類の購入に充てる予定である。
|