研究課題/領域番号 |
26560167
|
研究機関 | 早稲田大学 |
研究代表者 |
後藤 正幸 早稲田大学, 理工学術院, 教授 (40287967)
|
研究期間 (年度) |
2014-04-01 – 2017-03-31
|
キーワード | 大規模データ / 大規模ログデータ / パターン認識 / 機械学習 / ユーザ行動 / 潜在クラスモデル / テキストマイニング / 時系列分析 |
研究実績の概要 |
本研究では,ECサイト等のデータベースに蓄積される大規模ログデータに基づき,ユーザ行動の分析を通じて,経営判断やマーケティングツールとして活用するための次世代パターン認識手法の開発と応用技術の確立を目指しており,平成27年度も前年までの研究に継続し,実際のユーザ行動履歴データを対象とした分析を行いつつ,理論的にも汎用性の高いと考えられる手法について研究を行った。特に,これまでに着手している,ユーザ嗜好の時間的推移を分析するための潜在クラスモデル活用法や行列分解の手法を用いたスパースデータの分析について検討を継続した。 平成27年度は,実店舗のID付き購買履歴データを分析するためのモデルとして,商品アイテムの季節性を考慮した潜在クラスモデルの開発と学習手法の提案を行っている。この手法の有用性は,実際の購買履歴データの分析を通じて検証を行った。 また,これに加えて,就職ポータルサイトのユーザ行動履歴データに対し,ユーザのエントリー行動のモデルについて,新たにいくつかのモデルを提案すると共に,効果的な学習アルゴリズムの構築を行った。この研究の成果は,ECサイトの大規模購買履歴データの分析など,他の特徴の異なるデータや対象問題についても有用な知見を与えており,今後,いくつかの問題に対象を広げて検証を行う予定である。 さらに,対象となる実データを広げるため,平成27年度は,いくつかの新たな実企業と協力提携し,分析対象となる実データを増強した。これらの実データに共通する特徴を分析し,汎用性の高い分析モデルを検討すると共に,個々の事例特有の問題に合致した手法の検討に着手している。 以上の研究の成果は,平成28年度の国内学会,並びに国際会議にて発表の予定である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究では,ECサイト等のデータベースに記録される大規模ログデータに基づき,ユーザ行動を分析して,経営判断やマーケティングツールとして活用するための次世代パターン認識手法の開発と応用を目的としており,すでに基本的なアイディアの具現化や実データによる評価が進行中である。研究期間2年目となる平成27年度も,前年までの研究を継続し,共同研究先企業音実データを用い,特徴的なユーザ行動をモデル化する方法や商品の購買履歴データを分析するための新たな潜在クラスモデルを提案し,その評価を行っている。また,平成26年度中に研究成果として出始めた分析モデルや解析事例については,平成27年度中の国内学会と国際会議にて成果発表を行い,様々な専門家からの評価を得ている。 また,平成27年度は,顧客ユーザの購買履歴データを分析する新たなモデルとして,商品の季節性を考慮した潜在クラスモデルを提案し,小売りの実データを用いて,その有効性を検証するなどの一定の成果を得た。就職ポータルサイトのユーザ行動履歴データの分析モデルについても,新たな観点からの分析モデルを複数提案しており,実証的な有効性の検証も進んでいる。 これらの成果は,平成28年度の国内学会において順次発表を行い,専門家からのコメントや評価を反映し,さらに研究内容を発展させる予定である。 以上のように,ECサイト等におけるユーザの行動パターン分析のためのパターン認識手法の確立に向け,平成27年度も研究の地盤を固めると共に,いくつかの方向に発展させることができており,研究の進捗状況としては概ね順調に進展していると考えられる。
|
今後の研究の推進方策 |
本研究では,ECサイト等のデータベースに記録される大規模ログデータに基づき,ユーザ行動を分析して,経営判断やマーケティングツールとして活用するための次世代パターン認識手法の開発と応用を目的としており,企業との共同研究やデータ解析コンペティションによって提供される実データを対象として,実証的な評価分析を並行しながら,新たな分析手法の構築を行っている。今後も,各企業との共同研究やデータ解析コンペティションの実データを対象としたサブ研究グループにおいて密な研究と検討を継続すると共に,定期的に研究グループ全体での議論と情報共有を行うことにより,個別テーマの推進と結果の共有を図る。さらには,新たに共同研究先企業を増強し,これまでに取り扱った経験のない構造や特徴を有する実問題についても調査を続ける。 ECサイトなどのデータベースに記録される大規模ログデータは,商品アイテムの購買履歴に加え,個別の商品アイテムページの閲覧履歴や検索履歴,ボタンのクリックやスクロールなどのかなり細かい行動履歴を取得することが可能となっており,このような多様なデータの分析技術について検討を重ねる予定である。特に,「ユーザが購買を迷っている状態」というパターンを,高精度かつ高速に発見できれば,有効なマーケティングン施策に結び付けることが可能である。本研究では,そのようなより多様で複雑なユーザ行動の問題について,検討を加える予定である。 一方で,本研究が提案する方法論は,広く適用可能な一般性を有していることを期待しており,そのための評価を重視している。すでに,平成27年度にいくつかの共同研究先企業を増やし,評価や分析対象として活用できる実データの整備を進めてきたが,研究最終年である平成28年度もその方向性を維持する。さらに,サブ研究プロジェクトを新たに立ち上げると共に,相互の研究成果の共有によって相乗効果を目指す。
|
次年度使用額が生じた理由 |
本研究では,ECサイト等のデータベースに記録される大規模ログデータの分析が必要となるテーマを対象としており,データを分析するための環境整備のための物品費用と一定の研究補助謝金の使用が必要である。平成26年度は,ほぼ予算計画通りの支出となったが,平成27年度は研究環境を継続して利用したことに加え,新たなデータの取得と新規モデルの立案・検討に注力したため,実際のデータの整形や分析作業にかかる経費の支出がなく済んでいる。しかし,一方で平成27年度に新たなユーザ行動履歴データの収集が行われており,新たな分析作業が平成28年度にずれ込んで必要のなるとの観点から,この予算執行については平成28年度に執行することとし,次年度使用額として残すこととした。平成27年度の予算に組み込んで適性に使用する予定である。
|
次年度使用額の使用計画 |
本研究では,実際のECサイトにおけるユーザの行動履歴データをあつかっており,一般にユーザのあるページにおける行動履歴は,非常に多様性が高い。加えて,どのように特徴空間を構成すべきかについても理論が固まっていない。本研究では,共同研究先企業が保有する膨大な実データを対象とし,次世代パターン認識技術の開発を目指しており,このような生データの整理や構造化のための作業を研究補助として委託し,謝金を使用する予定である。平成27年度に生じた残額についても,研究補助の謝金に組み込むと共に,その整形作業,分析作業に必要な作業環境を整えるための物品費に使用する予定である。 また,最終年度である平成28年度は,多くの成果発表を予定しており,そのための学会発表旅費,参加費等の成果報告のための費用に使用する予定である。
|