2021 Fiscal Year Research-status Report
消費者・商品・時間を考慮したNMF技術開発と購買行動・心理関係メカニズムの把握
Project/Area Number |
19K13822
|
Research Institution | Kyoto University |
Principal Investigator |
阿部 寛康 京都大学, 医学研究科, 助教 (40807963)
|
Project Period (FY) |
2019-04-01 – 2023-03-31
|
Keywords | 非負値行列因子分解 / 零過剰モデル / 変分ベイズ法 / 基底数選択 / ロジスティック回帰モデル / ウェブサイト閲覧履歴 / ノンパラメトリックベイズ / 棒折り過程 |
Outline of Annual Research Achievements |
本年度の前半では、昨年度から検討を始めたノンパラメトリックベイズモデルに基づく非負値行列因子分解(以下NPMBNMFと記載)についてさらなる検討を実施した。NPMBNMFでは、NMFにおける基底数を制御する役割を果たす棒折過程と呼ばれる発生過程が組み込まれており、その中には1つの超パラメータが含まれている。1回の海外発表、および1回の国内発表により、その影響を探った結果を報告した。理論的にはこの超パラメータは最終的に推定される基底数の多さに影響を与えるとされており、行動履歴データでいえば抽出される潜在的な購買行動パターンの数に影響を与える。実データに対し様々な超パラメータの値で推定した結果、理論通りの影響の与え方を観察することができた。これに加えて、理論的に超パラメータを直接、アルゴリズムの中で推定可能であることも確認した。一方、本年度後半では、これまで検討してきた零過剰NMFモデルに心理・属性情報を取り入れた拡張版モデルについて検討した。これにより、「いずれのNMFモデルでも説明できない行動パターンが行われた際の消費者の心理側面の把握」が可能となる。ある購買行動がNMFモデルに従うか従わないかを決める二値の潜在変数に対して、心理・属性情報を共変量としたロジスティック回帰モデルを当てるのが拡張版モデルの特徴であるが、この部分の変分推論が実施可能であることを理論的に示すことに成功した。これにより一次的なパラメータは全て変分推論されることとなり、ベイズ的なモデル選択がより強固なものとなる。また、このロジスティック回帰部分の推定結果は、その解釈のしにくさが欠点であったのだが、WEB閲覧履歴データの場合に絞りその解釈パターンを整理した。これにより本手法を利用する分析者に対して結果の見方の指針を与えることができる。後半の研究については、現在論文執筆を進めており、近日投稿予定である。
|
Current Status of Research Progress |
Current Status of Research Progress
4: Progress in research has been delayed.
Reason
昨年度終了時点で予定していた「商品属性情報の組み込み」および「動的NMFによる外部環境の組み込み」の両方について、本年度は検討できなかったため、達成度としては遅れているといわざるを得ない。上記2点が実施できなかった理由は、本研究内容に関する問題と外部環境による問題の2点がある。前者については、消費者の心理・属性情報を取り入れるための拡張モデルにおけるロジスティック回帰部分の検討に関するものである。本研究の計画段階において、この部分は変分推論することが難しいと考えていたが、それが可能であることがわかり、その検討および結果のとりまとめに時間を費やしたことが第1の原因である。この検討はモデル選択の意味で重要であり、これを無視して次のステップに移ることは避けるべきと判断した。後者については大きく2点ある。1点目は新型コロナウィルス感染拡大の影響である。所属機関の諸業務・教育業務の対応に時間を割いたこと、および時差通勤に伴い所属機関への在籍時間が減少してしまったこと、学会での公式・非公式な場での議論の場が失われたことなどが挙げられる。2点目は本年度の前半において本研究を休止せざるを得なかったことが挙げられる。この時期は所属機関の業務の繁忙期と家庭の事情が重なったことで、本研究に掛ける時間が全く取れず、結果として研究の遅れにつながってしまったと考えている。
|
Strategy for Future Research Activity |
次年度は、今年度実施予定だった「商品属性情報の組み込み」および「動的NMFによる外部環境の組み込み」について検討する。商品属性情報の組み込みについては、現在検討しているショッピングWEBサイトの書籍ページの閲覧履歴データを用いて、商品分類レベルの低い方をアイテムとして扱い、そのレベルより1段上のレベルの商品分類を属性情報として扱うことを考えていく。一方の「動的NMFによる外部環境の組み込み」については、時間と商品分類を行と列に添えた閲覧カウントデータを想定し、各時間の状況(曜日、時間、その他イベントなど)を付帯的な変数として扱ったNMFモデルの構築を試みる。
|
Causes of Carryover |
次年度使用額が生じた理由は3つある。1つ目の理由はシミュレーション計算を実行するための高性能PCの購入が遅れていることである。購入を検討し始めた本年度初旬時点において、新型コロナウィルスの世界的パンデミックが原因とされる半導体不足により、本研究で必要とする計算パワーを要するPCの購入が困難となった。本年度も初旬より引き続き購入を検討する。2つ目の理由は、学会発表を予定通り実施することができなかったことである。研究の進捗が遅れていることにより予定回数の学会発表が実施できなかったこと、および所属機関の制限により出張ができず学会発表における旅費使用がなかったことで、結果として使用額が少なくなってしまったことが挙げられる。3つ目の理由は、研究の遅れにより、論文執筆にかかる英文校正代等費用がなかったことである。次年度においては現在執筆中の論文原稿があるため、1件分の英文校正代がかかる見込みである。
|