2019 Fiscal Year Research-status Report
Research on Database Systems for Supporting Life Cycles of Data Models based based on conntents
Project/Area Number |
18K11318
|
Research Institution | Tsuda University |
Principal Investigator |
中野 美由紀 津田塾大学, 学芸学部, 教授 (30227863)
|
Project Period (FY) |
2018-04-01 – 2022-03-31
|
Keywords | データベース / データモデルライフサイクル / 機械学習 / 統計解析 / データ解析 |
Outline of Annual Research Achievements |
本研究では、コンテンツを主体とした効率のよい「データモデルのライフサイクル」を支援するデータベース環境を確立するために、データモデルのライフサイクルを典型的なデータ解析処理(単純ベイズ、クラスタリング、深層学習等)と具体的事例(政府統計データ、オープンデータ)を用いてコンテンツ主体のデータ管理手法を設計し、「データモデルのライフサイクル」の支援の有効性について具体的事例を基に検討する。平成30年度は、1)「データモデルのライフサイクル」および「知識発見プロセス」の過程からコンテンツと共にあるべきログ情報(クレンジングの過程、特徴量抽出や学習過程等)およびライブラリィ情報(処理アルゴリズム、最終の予測・推定モデル等)に関する検討を行うための、実験環境の準備、整備を行い、予備実験として簡単なアプリケーションを構築した。 昨年度までに収集されたデータ(予定:単純ベイズを用いた混雑予測モデルと野球動員数、k-means法を用いた特徴量抽出とレストランデータ、SVMを用いた教師用データの生成、深層学習(CNN)を用いた姿勢推定モデルとスポーツ画像)を時系列においてどのような変動があるかについて統計解析を時間区間を変化させて調べると共に、データベースおよび従来のデータ解析処理環境(R、python, Tensorflow)上において比較可能となるシステムの構築を目指した。さらに新曲が多く発表される音楽を対象に、音楽データベース情報の収集を行い、データモデルライフサイクルとして、人気度による変動についての解析実験を行い、データベースにおけるデータ変化の定量的指標に向けての検討を行った。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
準備されたデータの解析は順調に進んでいるが、機械学習モデルの変化とデータの変化の関連性については、定量的な評価の指標についてさらなる検討が必要となっている。
|
Strategy for Future Research Activity |
現在、公共交通機関等のデータも収集しており、特性の異なるデータとその機械学習モデルにおいて、データの変化とそれに伴うモデルの変化の関連性および、データベース上の指標としての有効性について検討する予定である。
|
Causes of Carryover |
新型コロナにより学会出張が中止となったため、出張費、学会参加費等が次年度繰り越しとなった。状況をみつつ、学会発表など成果の展開に利用する予定である。
|