2021 Fiscal Year Research-status Report
購買履歴データと健康情報の融合による疫学的消費行動モデルの構築
Project/Area Number |
21K18227
|
Research Institution | The University of Tokyo |
Principal Investigator |
中谷 朋昭 東京大学, 大学院農学生命科学研究科(農学部), 准教授 (60280864)
|
Co-Investigator(Kenkyū-buntansha) |
阿部 貴行 横浜市立大学, データサイエンス学部, 准教授 (10594856)
田栗 正隆 横浜市立大学, データサイエンス学部, 教授 (20587589)
上田 雅夫 横浜市立大学, データサイエンス学部, 教授 (20755087)
小泉 和之 横浜市立大学, データサイエンス学部, 准教授 (70548148)
岩崎 学 統計数理研究所, 統計思考院, 特任教授 (40255948)
坂巻 顕太郎 横浜市立大学, データサイエンス推進センター, 特任准教授 (30644819)
|
Project Period (FY) |
2021-07-09 – 2024-03-31
|
Keywords | 購買履歴データ / 食物摂取頻度調査 / 疫学的消費行動モデル |
Outline of Annual Research Achievements |
本研究は、食料政策や生活習慣病予防策の立案に必要なエビデンスを提供するために、これまで、複数の研究分野それぞれ独自に研究されてきた個人の生活様式とヘルスアウトカムとの関係に関する研究を、社会科学、自然科学および統計科学を活用して統一的に解明するモデル構築を目指すものである。 初年度である2021年度は、主として本研究が目指すさまざまな分析に供されるデータについて、その入手と整備を実施した。具体的には、第一に、家計の食料品を中心とする購買履歴を記録したミクロデータのデータクリーニングである。このミクロデータはレシート情報に基づいて個別品目の購買が記録されているが、商品名の表記のゆれなどを調整したり、品目カテゴリごとに集約するなどして分析に供される。この過程は完全に自動化することができず、目視での確認などを含む半自動化作業である。第二は、家計の栄養素摂取に関する情報を得るために、購買履歴を記録している世帯に対する食物摂取頻度調査を実施した。 本研究の分析目的を達成するためには、同一対象に対して行った異なる二つのデータソース、すなわち購買履歴ミクロデータと食物摂取頻度調査を統合する必要がある。そのためには、購買履歴データに記録された個別商品の内容量や含有物についての詳細情報が必要となるが、事前の予想通り、現状ではそのようなデータベースが存在しないなどの点が明らかになった。そのため、統計学的な方法によって購買履歴データと栄養素摂取を結びつける変換係数の開発の重要性が浮き彫りとなた。 以上のように、異なるデータソースの統合には解決すべき課題も多いため、研究初年度においては、それぞれのデータを用いた分析を行なった。特に、購買履歴データを利用して、新型コロナウイルス拡大に対する緊急事態宣言発令による家計の食料品カテゴリの支出シェアの変化に関する分析をおこなった。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
2021年7月の採択内定以降、購買履歴データの購入および食物摂取頻度調査を実施した。購買履歴データは、2019および2020年度の2カ年度分について、食費・外食費のほか、日用品および美容・健康・医療衛生関連項目の詳細データである。食物摂取頻度調査は、購買履歴データのモニタから抽出した対象者に対して、2021年末に実施した。現在までに、購買履歴データは、個別商品名の表記の揺れの調整や、製品カテゴリの集約方法の検討をおこなっている。食物摂取頻度調査データは、調査票に基づいて調査会社による栄養素摂取記録への変換が実施されるている。 本研究の目的を達成するためには、以上二つのデータセットを統合する必要があるが、購買履歴データから栄養素摂取量を推定するためには、JANコードに基づく商品情報と、当該商品の内容量・含有物の突合が必要である。しかし、このような情報を含むデータベースが存在しないために、本研究が当初予想した通り、何らかの方法で両者を結びつける変換係数の開発が求められる。この間、研究分担者間でのディスカッションを通じて、統計的に望ましい推定方法についての検討を行なっている。 現時点では、それぞれのデータセットを独自に用いた研究が可能である。特に購買履歴データは、新型コロナウイルス感染症が家計の食料消費にどのような影響を及ぼしたのかを分析する上で、重要な情報を含んでいる。そこで、新型コロナウイルス拡大に対する2回の緊急事態宣言発令と、食品カテゴリごとの支出シェアの変化との関連について分析したところ、第1回目の発令では食料品カテゴリの支出シェアを変化させる影響があったが、第2回目にはその影響は認められなかったなどの知見を得ている。 以上のように、半年強の研究期間においては十分な成果ないしは成果が見込まれる状態にあることから、研究はおおむね順調に進展していると判断した。
|
Strategy for Future Research Activity |
今後の第一の課題は、購買履歴データと食物摂取頻度調査のデータを統合する望ましい方法を検討することである。具体的な方策としては、購買履歴データから推定される栄養素摂取の量と、食物摂取頻度調査から推定される栄養素摂取の量とを比較し、その変換係数を構築する。ただし購買履歴データから栄養素摂取量を推定する場合、前述のように利用可能なデータベースがないために、いくつかの工夫が求められる。その際には、農業経済、マーケティング、疫学、統計学といった学際的な共同研究者のバックグラウンドが有益に作用すると考える。 購買履歴データは、新たに2021年度分を追加で入手する。さらに、食物摂取頻度調査も実施する。これにより、同一被験者の複数年にわたる購買行動と食物摂取に関するパネルデータを構築する。 また、これらのパネルデータを利用して、統計学的により望ましい方法に基づいて消費者の購買行動と栄養素摂取に関する分析を実施する。 以上の分析については、2021年度に実施したものと併せて、学会等での報告や論文投稿を通じて速やかに公表する。 以上に加えて、健康診断のデータとそれに伴う特定保健指導の情報も入手している。この情報と購買履歴データを利用することで、特定保健指導という介入が消費者の購買行動にどのような影響を及ぼすのか、具体的に明らかになるものと考える。特に、タバコなどの嗜好品や甘味食品の購買について、特定保健指導のタイミングや回数など、今後の改善策につながる示唆が得られるものと考えられる。
|
Causes of Carryover |
新型コロナウイルス感染症のために、参加を予定していた学会が中止・延期になったりオンライン開催となったため、旅費として計上していた費用を中心に次年度使用額が生じた。 これらの経費は、国際学会への参加に充てる予定だが、新型コロナウイルス感染症の収束状況が不確実であるため、状況に応じて、新たなデータ入手やソフトウエア等の解析基盤の整備に充てることも想定している。
|