研究課題/領域番号 |
18K11318
|
研究機関 | 産業技術大学院大学 |
研究代表者 |
中野 美由紀 産業技術大学院大学, 産業技術研究科, 教授 (30227863)
|
研究期間 (年度) |
2018-04-01 – 2022-03-31
|
キーワード | データベース / データモデルライフサイクル / 機械学習 / 統計解析 / データ貝瀬kい |
研究実績の概要 |
本研究では、コンテンツを主体とした効率のよい「データモデルのライフサイクル」を支援するデータベース環境を確立するために、データモデルのライフサイクルを典型的なデータ解析処理(単純ベイズ、クラスタリング、深層学習等)と具体的事例(政府統計データ、オープンデータ)を用いてコンテンツ主体のデータ管理手法を設計し、「データモデルのライフサイクル」の支援の有効性について具体的事例を基に検討する。平成30年度は、1)「データモデルのライフサイクル」および「知識発見プロセス」の過程からコンテンツと共にあるべきログ情報(クレンジングの過程、特徴量抽出や学習過程等)およびライブラリィ情報(処理アリゴリズム、最終の予測・推定モデル等)に関する検討を行うための、実験環境の準備、整備を行い、予備実験として簡単なアプリケーションを構築した。 具体的には、データ解析処理の典型例と処理対象のデータ(予定:単純ベイズを用いた混雑予測モデルと野球動員数、k-means法を用いた特徴量抽出とレストランデータ、SVMを用いた教師用データの生成、深層学習(CNN)を用いた姿勢推定モデルとスポーツ画像)の収拾を行い、データベースおよび従来のデータ解析処理環境(R、python, Tensorflow)を準備した。 さらに新曲が多く発表される音楽を対象に、音楽データベース情報の収集を行い、推薦モデルを構築し、データ変化によるデータモデルライフサイクルの実験準備を行った。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
データ準備、モデル構築など順調に進んでいる。
|
今後の研究の推進方策 |
研究当初の計画通りに進める予定である。
|
次年度使用額が生じた理由 |
30年度は、既存のデータ収集用システムを利用して、準備を行ったため、当面予定していた新しい実験環境の構築は次年度となった。次年度、既存のデータ収集用システムを基に新たなシステム(データ差分ごとの実験環境)を構築する予定である。
|