令和元年度から2年度にかけて、本研究の基盤技術となる零過剰負の二項分布に基づく非負値行列因子分解(NMF)について数値実験・実データ応用を通じて検討した。推定法として当初はサンプリング法を志向したが、より効率的な変分推論法に切り替え検討した。結果、データを解釈する上で重要となる基底数選択や基底行列を概ね精度よく推定できることを確認した。一方で、これの代替案として令和2年度から3年度初頭にかけて検討したノンパラメトリックベイズ(NPMB)推定法に基づくNMFについても基底数選択を効率よく、かつ精度よく推定できることを確認したが、変分推論でも良好な結果が後に得られたこと、およびモデル表現の柔軟さの点を考慮し、計画通り変分推論法を志向する方針とした。令和3年度はこれまで検討したNMF手法を、心理・属性情報を用いてデータに含まれる「0」要素に対する解釈を深化させる拡張について、数値実験および書籍のWEB店舗における閲覧履歴データへの応用を通じて検討した。各種検討の遅延およびcovid19による混乱等のため、ここまでの進捗は計画通りでなかったことから、本研究を1年延長申請し、令和4年度において「動的NMFによる外部環境の組込み」および「商品属性の組込み」の検討を行った。前者については、詳細な文献調査の結果、扱う分布が正規分布以外の場合に、基底行列と時間に関する係数行列の同時推定が困難であることが判明したため、検討を断念した。後者については、商品属性として商品ラベルに注目し、同じラベル内の商品の共起関係とそれを除いた上で抽出される異なるラベル間の共起関係をそれぞれ「同質基底」「異質基底」と表現したNMF手法を考案し検討した。変分推論に基づき同質基底数と異質基底数の選択を回帰モデルの変数増加法を模して同時に行うことを提案し、数値例により異質基底を概ね正確に捉えられる結果を得られた。
|