2021 Fiscal Year Annual Research Report
データ駆動型社会の基盤をなす次世代実験計画技術の開発と実証的評価
Project/Area Number |
21H04600
|
Research Institution | Waseda University |
Principal Investigator |
後藤 正幸 早稲田大学, 理工学術院, 教授 (40287967)
|
Co-Investigator(Kenkyū-buntansha) |
上田 雅夫 横浜市立大学, データサイエンス学部, 教授 (20755087)
守口 剛 早稲田大学, 商学学術院, 教授 (70298066)
関 庸一 群馬大学, 大学院理工学府, 教授 (90196949)
鈴木 秀男 慶應義塾大学, 理工学部(矢上), 教授 (10282328)
生田目 崇 中央大学, 理工学部, 教授 (10318222)
小林 学 早稲田大学, データ科学センター, 教授 (80308204)
三川 健太 湘南工科大学, 工学部, 准教授 (40707733)
山下 遥 上智大学, 理工学部, 助教 (90754797)
|
Project Period (FY) |
2021-04-05 – 2025-03-31
|
Keywords | データ駆動型社会 / 機械学習 / 人工知能 / 実験計画 / 因果推論 |
Outline of Annual Research Achievements |
本研究では,以下の3つの基本的課題を設定し,研究に取り組んでいる. 1.(機械学習モデルの設計) 施策の最適化を目的とした実験計画のために,「機械学習に基づく統計モデル」を「追加実験によるデータ取得」と「施策の最適化」に結び付けるプロセスの全体像,及び,効果的な実験計画を可能とする機械学習モデルを如何に設計すべきか. 2.(効率的な追加実験の計画手法構築)大規模ログデータから構築された統計モデルが与えられたもとで,最小限の回数で最適施策の探索に結び付ける,効率的な追加実験を如何に計画することが可能か. 3.(施策の最適化と因果効果の評価手法の開発) 大規模データから得られた統計モデルと実験データを統合し,どのような方法で施策を最適化するか.加えて,共変量やデータの選択バイアスを考慮し,施策の因果効果を精度よく評価することが可能であるか. 2021年度は,これらの研究課題に関連する領域として,“能動学習”,“ベイズ最適化”,“バンディッドアルゴリズム”,“因果推論”の領域の体系的整理を行う研究会を定期開催し,その全体的な体系の明確化と問題点の整理を行った.これと並行して,「1.機械学習モデルの設計」については継続して企業の実問題を対象として研究を行い,様々な具体的事例に対して機械学習モデルを活用する技術基盤についての成果を得ている.また,「2.効率的な追加実験の計画手法構築」については,過去の大量のログデータを学習した機械学習モデルを活用して,いくつかの仮説のもとにA/Bテストを計画し,実ビジネスにおいて実証的に検証する試みを行った.今のところ,完全に再現性のある結果は得られていないが,様々なノウハウが蓄積されたため,今後の研究に結びつける予定である.「3.施策の最適化と因果効果の評価手法の開発」については,ベイズ最適化と因果推論モデルの実活用と改良を行い,一定の成果を得ている.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
2021年度は,本研究課題に関連する領域として“能動学習”,“ベイズ最適化”,“バンディッドアルゴリズム”,“因果推論”の領域の体系的整理を行う研究会を定期開催し,その全体的な体系の明確化と問題点の抽出を行うと共に,いくつかの実験的な検証も行って課題を整理した成果をまとめ,情報処理学会第84回全国大会にて発表した.これらの成果は,2022年度の研究活動に向けて重要な知見やノウハウを提供しており,今後の研究への継続が期待できる. 本研究課題が設定している3つの基本的課題のうち,「1.機械学習モデルの設計」については,複数の企業との共同研究を通じて,実ビジネスにおいて活用し得る機械学習モデルの構築を行った.その成果は,ビジネスにおける実運用を通じて実証的に検証も行っており,いくつかの良好な結果が得られている. 「2.効率的な追加実験の計画手法構築」については,単に大量のログデータを学習することで構築された機械学習モデルでは,しばしば追加実験において想定した結果が得られないことが判明している.このことから,過去のログデータから構築された機械学習モデルを用いて,実ビジネスの意思決定を行うことには一定のリスクが伴う.そのため,本研究課題が掲げる運用実験による効果検証が必要不可欠であると言える. 「3.施策の最適化と因果効果の評価手法の開発」においては,まず,ベイズ最適化を活用したビジネス施策の最適化について検討を行った.ベイズ最適化は,ビジネス施策を表す変数が高次元でなければ適用可能な手法であるが,一般には多様なビジネス施策が考えられることが一般的であり,何らかの改善や新たなフレームワークの構築が必要であることが明らかとなった. 本研究では,以上のように現状の課題感について,ある程度の明確なイメージを構築できており,2022年度の研究活動に向けた研究計画を立てることができる段階にある.
|
Strategy for Future Research Activity |
2022年度以降も,前年度の研究活動を継続し,まずはベイズ最適化や因果推論モデルの枠組みで発展してきた周辺技術について,ビジネスデータ分析の応用上の課題について実証的な評価を行う.加えて,3つの基本的課題である「1.機械学習モデルの設計」,「2.効率的な追加実験の計画手法構築」,「3.施策の最適化と因果効果の評価手法の開発」を研究の軸として研究を継続する. 基本課題1と2については,複数の企業事例を具体的な研究対象として研究を進める.また,施策最適化という問題設定を適切に定式化し,そのための統計モデリングについて実務的な知見と機械学習の最先端技術に関するノウハウを総動員し,徹底的な検討を行う予定である.加えて,深層学習モデルの一手法であるオートエンコーダと埋め込み表現(embedding)モデル等の先進的データ分析技術を駆使し,高次元空間上の非線形構造を低次の潜在意味空間上に写像することで,効果的な実験の計画を可能とする枠組みの開発を進める.事例研究と平行して施策最適化の数理モデル構築にも着手し,実問題のエッセンスを抽出したモデルの改良を継続する.基本課題3については,共同研究先企業とも密に連携し,計画した実験を実際のビジネスで実施することによる実証的な検証を併せて進める予定である.本研究では,演繹アプローチと帰納アプローチの双方から研究を進め,それらの知見を統合する. 研究全体の進捗統括は代表者の後藤が行い,分担者の三川と山下がサポートに入る.分担者の守口と上田はマーケティングの観点から本研究課題に取り組む.また,分担者の鈴木,関,生田目は,マネジメント技術やデータ解析技術の観点から本課題にアプローチし,山下を通じて研究代表者グループと連携する.分担者の小林と三川は,数理最適化の観点から演繹アプローチにより本研究課題に取り組み,代表者と連携して理論構築を目指す.
|
Research Products
(84 results)