研究課題/領域番号 |
17H06779
|
研究機関 | 京都大学 |
研究代表者 |
阿部 寛康 京都大学, 医学研究科, 特定助教 (40807963)
|
研究期間 (年度) |
2017-08-25 – 2019-03-31
|
キーワード | 非負値行列因子分解 / 購買行動 / 心理 |
研究実績の概要 |
平成29年度は,本研究の最終目的である「消費者の購買行動と心理面の関係性の探索的把握」のために必要なデータ解析手法の開発に向けての準備・検討を行った.開発する手法は非負値行列因子分解(以下,NMFと記述する)というデータ解析手法の拡張であり,各種NMF手法に関する文献を参照し,これをベースにして,以下の2つの解析手法を提案し,それぞれ検証を行った. 1つ目は,「補助変数を用いた零過剰ポアソン非負値行列因子分解」である.これは,購買行動の履歴データと,消費者の心理を表す質問紙データを結び付けて同時的に解析するための統計モデルであり,この統計モデルに含まれる各種パラメータをデータを用いて推定し解釈することで,目的を達成することができる. 2つ目の解析手法は,「補助変数を用いた零過剰複合ポアソン非負値行列因子分解」である.1つ目とは統計モデルの中で想定する確率分布がより一般化されたものであるという点で異なるが,手法開発の目的は1つ目と全く同じであるため,検証の価値がある. 以上の2つの解析手法を行うためのプログラムを開発し,これが正常に作動するかどうかの確認や,数値シミュレーションを用いた開発手法の性能評価を行った.結果的には,2つ目の手法において,ある条件下では推定がうまくいかない可能性があることが示唆されたが,その他はおおむね想定通りの結論が得られた.この結果は,平成30年度で実施予定の,実データを用いた本手法の適用において,参考となる情報である. 以上の2つの開発手法は,購買行動パターンの推定に加えて,そのパターンのいずれにも従わない購買行動を消費者の心理面から説明するモデルも同時的に推定できるものである.平成30年度の研究では,本年度の研究成果を踏まえ,質問紙データが伴う購買行動履歴データに本2手法を適切に適用し,消費者の購買行動と心理面の関係を探索する.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
平成29年度は,消費者の購買行動と心理面の関係性の探索的把握を行うためのデータ解析手法を確立することと,把握のための実データの確保が目的であった. 前者については,まず,開発する手法の基盤となるNMF技術について文献等を取りまとめ,これを参考にして,開発手法について数理的側面からの検討を行った.具体的には,本手法における統計モデルを数式によって正確に表現し,統計モデルがデータにどれだけあてはまっているかを測るための指標を適切に定め,これが最適になるような,モデルに含まれるパラメータの推定方式を導出した.推定すべきパラメータが多いため,推定方式は個別のパラメータをひとつずつ順番に更新することを繰り返す交互最適化と呼ばれる方式をとった.次に,導出した推定方式をアルゴリズムとして表現し,パラメータ推定を実際に行うためのコンピュータプログラムを作成した.最後に,コンピュータプログラムが正確に作動することの確認およびパラメータ推定の良さを計測するための数値シミュレーションを行った.具体的には統計モデルに含まれるパラメータの正解の値をあらかじめ決めておき,この正解値を用いたモデルから疑似的なデータを発生させて,このデータを作成したプログラムに適用させてパラメータ推定を行い,その推定値と正解値がどれだけ近い値になったかを調べた.結果的には,おおむね正解値に近い推定値が得られることを確認できた. 以上より,前者の目的についてはおおむね達成できていることに加えて,平成30年度で予定していた解析手法の数値シミュレーションに基づく点検についても,既に着手している.しかしながら,後者の実データの確保には現状至っておらず,平成30年度においても引き続き確保に向けて動いていく必要がある.以上のことから,全体的にはおおむね順調に進行していると自負する.
|
今後の研究の推進方策 |
平成30年度では,平成29年度にて開発したデータ解析手法の性能比較,および実データ解析を通じた購買行動と心理の把握を目標としている. 前者は既に着手している取り組みであるが,現状では,数値シミュレーションにおける疑似データの条件が限られたものとなっているため,より条件を広げた疑似データにおける性能比較を行っていく.具体的には,履歴データの大きさをより大きいものにする(顧客および商品(群)の数を増やす)ことや,質問紙データの質問数を増やす,などである. 一方後者については,どのような顧客がどのような商品(群)をどれくらい購入したか,といったような購買履歴データと,履歴データに含まれる顧客の特徴や心理面をとらえた質問紙データが両方とられているようなデータを想定している.現状このような実データは確保できていない状況であり,データ確保に向けて,各種企業の情報やフリーデータの可能性を探っていく予定である.データの確保ができるまでは,限りなく実データに近い性質を持つような疑似データを作成し,開発手法を適用させ,狙い通りの解釈ができるような結果が得られるかどうかについて,さまざまな角度から検討を行っていく.例えば,ある商品Aと商品Bは同時に購入される傾向にあるが,一部において商品Bを嫌って購入せず,商品Aのみ購入する顧客がおり,このような顧客は実は節約志向であり,実は割高である商品Bを購入しなかった,といった状況を想定した疑似データを作成し,実際に開発手法で解析を試みて,結果を解釈する.他の方策としては,データが確保できない場合は,他のより確保しやすい履歴データ(例えばWeb等の閲覧履歴など)を確保し,開発手法による解析によって得られる結果を用いてどのような解釈が行えるかを十分に検討し,解析を行っていくなどの対応をとる.
|