研究課題/領域番号 |
19K04914
|
研究機関 | 早稲田大学 |
研究代表者 |
小林 学 早稲田大学, データ科学センター, 教授 (80308204)
|
研究分担者 |
平澤 茂一 早稲田大学, 理工学術院, 名誉教授 (30147946)
松嶋 敏泰 早稲田大学, 理工学術院, 教授 (30219430)
|
研究期間 (年度) |
2019-04-01 – 2023-03-31
|
キーワード | データ解析プラットフォーム / ビッグデータ / 機械学習 / 協調フィルタリング |
研究実績の概要 |
本研究は企業の持つクローズドなビッグデータをセキュアな環境のもとで解析を実施するプラットフォーム(PF)の構築,並びにその運用方法の検討と,このシステムを利用した時変協調フィルタリング手法の提案が目的である. PFに関して,2020年度は伊藤忠テクノソリューションズと協同して構築したデータ解析PFの拡張を行った.具体的にはJupyter NotebookによるPython及びRのみであったのに対し,Windows環境でSASやSPSSを利用可能にする分析環境の構築を新たに行い,多くのプロジェクトにおいてPFを利用可能にした.さらにセキュアな環境における分析事例として,みずほ銀行データを用いたコロナ禍の影響分析プロジェクトに協力し,PFに必要な知見を得た. 一方時変データの分析において,回帰や分類問題は非常に重要な位置づけを持つ.これは時間を説明変数の一つとみなすなどができるからである.本研究では誤り訂正出力符号(ECOC)を用いた自動分類手法において,事後確率最大分類可能な2値分類器を用いた場合に,最適なECOCの十分条件を導くことに成功した.この十分条件は符号語の対称性から導かれ,例としてk-versus-rest符号やExhaustive符号などが含まれる.また修正Reed-Muller符号は十分条件を厳密には満足しないが,これに近い構造を有しており有望であることが分かった.また説明性を重要視する回帰や分類手法として,一般化加法モデル(GAM),及びこれを拡張したGA2Mが提案されており注目を集めている.本研究ではGAM及びGA2Mの基底関数としてシンプルな回帰木を用い,ベイズ的アプローチを行う新しい手法の提案を行った.結果的に仮定した生成モデル及びその加法モデルに限定すると,従来の機械学習法を上回る精度を達成できることが分かった.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
上記研究実績で示したように,データ解析プラットフォーム(PF)の構築及び拡張,並びにデータ解析実験の実施まで行うことができている.また時変協調フィルタリングと大きく関連する分類や回帰におけるプリミティブな問題の解決に関連する種々の知見が得られたことは大変大きい.
|
今後の研究の推進方策 |
データ解析プラットフォーム(PF)の構築が完了予定で,本格的な実データを用いた解析の実験を行う.また時系列データに対する潜在構造分析として提案している数理モデルに対して,評価を実施する予定である.さらに分類及び回帰のプリミティブな問題に対するECOC法の適用,並びに回帰木に対するベイズ的アプローチの適用に対する,実データ分析を実施すること,並びにこれらの統計モデルの拡張及び時変協調フィルタリングへの応用の検討を行う.
|
次年度使用額が生じた理由 |
当初の予定と異なり,データ解析プラットフォーム構築のためのサーバ設備に関して研究代表者が所属する組織のハードウェア及びソフトウェアを利用することが可能になったこと,並びに研究に必要な設備を大学で用意されたものを有効に活用できたため. 予定していた情報収集に関して,コロナ禍の状況によって出張取り止め,あるいはオンライン会議による会議費の大幅削減の影響も理由として挙げられる.
|