2015 Fiscal Year Annual Research Report
大規模データ時代のビジネスアナリティクス手法に関する基礎的研究
Project/Area Number |
26282090
|
Research Institution | Waseda University |
Principal Investigator |
後藤 正幸 早稲田大学, 理工学術院, 教授 (40287967)
|
Co-Investigator(Kenkyū-buntansha) |
三川 健太 早稲田大学, 理工学術院, 助手 (40707733)
平澤 茂一 早稲田大学, 理工学術院, 名誉教授 (30147946)
須子 統太 早稲田大学, 社会科学総合学術院, 講師 (40409660)
堀井 俊佑 早稲田大学, 付置研究所, 助教 (00552150)
小林 学 湘南工科大学, 工学部, 教授 (80308204)
鈴木 誠 湘南工科大学, 工学部, 教授 (80339796)
山下 遥 早稲田大学, 理工学術院, 助手 (90754797)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | ビジネスアナリティクス / 大規模データ / ビッグデータ / マーケティングモデル / 経営情報分析 / レコメンデーション / 経営工学 / 統計モデル |
Outline of Annual Research Achievements |
本研究では,1) ECサイトのデータベース情報を対象とした情報分析技術の開発,2) テキストデータとして蓄積されるマーケティング情報の分析技術の開発,3)情報推薦のための統計モデルの開発,4)情報検索や推薦の技術を活用したWebマーケティングモデルの理論解析,5)高次元かつ疎な大規模データを対象とした分析手法の開発,6) プライバシー保護データ解析の方法論の開発という個別の研究テーマを並行して進めると共に,これらの成果を統括的な観点からまとめることで,研究実績と進捗の評価,並びに研究方法の見直しを継続的に行っている.平成27年度は,前年度に引き続き,これらの個別研究テーマについて深度を深めると共に,定期的に成果交流を推し進めた. 平成27年度も特にビジネスアナリティクス分野で重要な対象となる1)~3)の個別テーマについて,大学院生の協力も得ながら強力に研究を推進した.1)については,共同研究を通じ実データを用いた分析を推し進め,いくつかの新たな分析モデルを提案すると共に,その学習アルゴリズムの提案も行った.2)についても,混合Polya分布モデルを用いたテキスト分類手法など,新たな分析手法の開発を行った.3)については,行列分解や潜在クラスモデルを駆使したレコメンデーションモデルについて研究を行い,モデルと推薦ロジックの改良を行った.これらの成果は,ID-POSデータを駆使したクーポン発見ロジックにも応用可能であり,期待売上によるクーポンの効果測定を可能とする統計モデルの開発も行った.新たなモデルや計算アルゴリズムの有効性は,実データへの適用を通じて有効性を検証している.4)~6)についても個別の成果を得ており,順次,国内学会や国際会議にて成果を発表した.今後も継続的に研究成果の発信を行う予定である.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究では,研究代表者,並びに研究分担者の他,研究代表者の研究室に所属する助手,博士課程大学院生,共同研究者,修士課程大学院生メンバー13名,学部学生10名が各研究チームを組み,それぞれの個別研究テーマについて日々検討を進めている.定期的に,実データを提供頂いている共同研究先企業との研究報告会も実施し,実務の現場に携わるビジネスパーソンの観点からのフィードバックも反映している.その成果は,国内学会や国際会議における研究発表にて成果発信を継続しており,また学会誌の査読付き論文の掲載も順調に増えていることから,研究は当初の予定通り,順調に進展していると判断できる. 本研究では,①大規模データ時代のビジネスアナリティクスを強力に支援するための情報分析手法の開発と応用,並びに②情報技術と統計的学習理論の知見を最大限に活用したWebマーケティング技術の開発と理論的評価を行うことを主たる目的としており,平成27年度も,複数の実企業が有する大規模な購買履歴・閲覧履歴データを入手して研究を推し進め,統計モデルと計算アルゴリズムの両面から興味深い研究成果を得ることができた.本研究では,単なる事例分析として実データを解析するだけではなく,基礎研究としての側面である広く適用可能な分析モデルの提案を目指して研究を進めた.特に,ECサイトにおける閲覧履歴と購買履歴の双方を活用した潜在クラスモデルを提案し,実データを通じて有効性を確認しており,その成果は査読付き論文として採択されている.また,国際会議においても合計15件の発表を行い,海外における研究成果発信に努めると共に,国内学会においても年間で30件以上の研究発表を行った.現在も,これらの研究成果を学術論文としてまとめ,5件が投稿中であり,研究の進捗状況は概ね順調である.
|
Strategy for Future Research Activity |
平成28年度も,1) ECサイトのデータベース情報を対象とした情報分析技術の開発,2) テキストデータとして蓄積されるマーケティング情報の分析技術の開発,3)情報推薦のための統計モデルの開発,4)情報検索や推薦の技術を活用したWebマーケティングモデルの理論解析,5)高次元かつ疎な大規模データを対象とした分析手法の開発,6) プライバシー保護データ解析の方法論の開発,という個別の研究テーマについて個別に研究を深化させる予定である.1)~3)については,研究成果が蓄積されていくフェーズに入っており,これまでに得られている研究成果を学会発表や論文としてまとめて成果発信すると共に,研究成果に対する自己評価と学会等において得られるフィードバックにより,さらに研究を加えるべき点を明確化する.特に,積極的に学会発表や論文投稿を行い,研究チーム外からの第三者的な視点での評価を受けて反映させることで,研究レベルの飛躍的な向上が期待できる. 4)のWebマーケティングモデルの理論解析では,これまでに商品推薦やテキスト分類といった高次元スパースなデータの分析が何故うまく働くのかについて,理論的な観点から評価を行ってきたが,この観点を5)の高次元かつ疎な大規模データを対象とした分析手法の開発研究の知見を融合させ,近年盛んに研究されているスパースモデリング分野の成果も積極的に導入することで,研究のさらなる推進を図る.6)に示したプライバシー保護データ解析では,ネットワーク上に分散保存されたデータを共有することなく,サポートベクトルマイン(SVM)という分類手法を適用可能な分散計算アルゴリズムについて研究を深める予定である. 以上の個別課題研究は,常に実問題を解くためのベースとなる基礎研究であることを意識し,単なるデータ分析事例に留まらない一般的な手法やモデル,並びに理論の構築を目指す予定である.
|
Causes of Carryover |
本研究課題においては,複雑で多様な大規模データに対し,統計モデルや機械学習手法が学習可能な形に成型し,データ構造を整えるための作業に多くのコストがかかる。このことは,平成28年も同様であり,十分な研究補助謝金の枠を残しておかない場合,研究成果をまとめる最終年の研究の実作業に支障をきたす恐れがある。すなわち,本研究では毎年十分な人件費・謝金を確保することが必要であり,そのため全額を使い切ることはせず,基金助成金の一部を最終年度に繰り越すこととした。 また平成27年度は研究を積み上げる年として,様々な研究成果の芽が生まれている。平成28年度は,それらをさらに発展させ,多くのシミュレーション実験や事例分析を行う予定である。それらの成果は順次,国際会議や投稿論文として発表する予定であり,そのための研究資金を確保する必要性もあることから,計画的な研究費使用に徹した。
|
Expenditure Plan for Carryover Budget |
本研究では,大規模かつ多様性を有するデータを対象としたアナリティクス手法の高度化と体系化を目指しており,最終年度である平成28年度においても,引き続き様々な企業の実データを取り扱う予定である。そのため,引き続き実務で有用となる統計モデルとアナリティクス手法の確立を目指し,必要データの抽出やデータ構造の整形,様々なパラメータに対する反復実験,シミュレーションのためのコーディングといった研究補助業務に対する謝金として研究費を利用する予定である。 また,研究の最終年度である平成28年度は,研究成果をまとめ,学会や国際会議,学会誌への論文投稿による成果発表を推進する予定である。そのための学会参加旅費,学術論文をまとめるための英文校閲料や論文掲載料についても,支出が増えることが予想され,これらの経費に予算を充てる予定である。
|
Research Products
(41 results)