2021 Fiscal Year Research-status Report
ビジネス価値創造のためのデータ解析プラットフォームと時変協調フィルタリングの研究
Project/Area Number |
19K04914
|
Research Institution | Waseda University |
Principal Investigator |
小林 学 早稲田大学, データ科学センター, 教授 (80308204)
|
Co-Investigator(Kenkyū-buntansha) |
平澤 茂一 早稲田大学, 理工学術院, 名誉教授 (30147946)
松嶋 敏泰 早稲田大学, 理工学術院, 教授 (30219430)
|
Project Period (FY) |
2019-04-01 – 2023-03-31
|
Keywords | データ解析プラットフォーム / ビッグデータ / 機械学習 / 協調フィルタリング |
Outline of Annual Research Achievements |
本研究ではデータを持ち出さずに解析を行うプラットフォーム(DAPF)の構築並びにその効果的な運用方法の提案を目的の一つとしている.現在までにクラウドを用いたDAPF(CDAPF),並びにオンプレミスによるDAPF(ODAPF)のそれぞれの構築が完了している.またCDAPFに関しては実運用を開始しており,現在みずほ銀行の実データの解析を行う3つのプロジェクトを実施している.これにより,DAPFの持つべき機能やセキュリティ等が明らかになってきている.またCDAPFについては2021年度に新たにVPN接続を可能にすることにより,大学外からセキュアにデータ解析を可能とした.さらにデータ持ち出しを防ぐためのチェック要件定義を行い,運用の効率化の実施を提案した. また顧客の消費行動に対するビジネス価値創造のための機械学習に関して,昨今説明性が大変重要になってきている.具体的にはデータの構造推定結果や予測関数の意味などが分析者に理解できる説明性が求められてきている.2021年度はこの説明性に着目して,回帰並びに分類というプリミティブな問題に対して,回帰木(あるいは決定木)に対する生成モデルを設定し,この生成モデルにおけるベイズ最適な予測を決定関数として出力する方法を示し,さらにこれにブースティングを適用することにより,非常に複雑な問題にも良好な性能を示す手法を提案した.この手法は一般化加法モデルの一種となることを示すことができ,説明性を担保することが可能である.これによって時系列の影響を可視化することが可能であり,非定常な場合に拡張が可能になっている. さらに,ディープラーニングを含む多値分類手法の複数の2値分類器の組合せで行われているが,これを効果的に行う誤り訂正出力符号(ECOC)が提案されている.この手法に対して理論的に最適な符号の構成,並びにその理論的な性能解析を行なった.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
データ解析プラットフォームの構築,セキュリティのチェック項目定義,並びに運用の実施が計画通り進んでいる.またビジネス価値創造のための時系列解析についても,説明性を担保した形の分析方法の提案ができてきており,計画通りに進んでいると考える.
|
Strategy for Future Research Activity |
現在実データの分析を実施している.この時,協調フィルタリングの問題では全ての顧客が全ての商品に対して消費行動を起こすわけではないため,ほとんどが欠測という扱いになる.特に時系列分析を行う場合には,ある一定の短い期間に発生する消費行動は少ないため,この問題がクリティカルになることも多い.そこで,欠測を考慮した協調フィルタリング手法の検討を行い,分析にフィードバックする予定である.
|
Causes of Carryover |
予定していたプラットフォーム用のサーバに関して,大学の保有するサーバを利用することができたため.またコロナ禍において,予定していた国際会議等への参加ができなかったため.
|
Research Products
(10 results)
-
-
-
-
-
-
-
-
-
-
[Book] データ科学入門I2022
Author(s)
松嶋敏泰,中原悠太,小林学,堀井俊佑,野村亮
Total Pages
192
Publisher
サイエンス社
ISBN
978-4-7819-1540-1