研究課題/領域番号 |
18K11318
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分60080:データベース関連
|
研究機関 | 津田塾大学 (2019-2022) 産業技術大学院大学 (2018) |
研究代表者 |
中野 美由紀 津田塾大学, 学芸学部, 教授 (30227863)
|
研究期間 (年度) |
2018-04-01 – 2023-03-31
|
キーワード | データ解析 / データベース・システム / データ流通 / データのライフサイクル / 機械学習 |
研究成果の概要 |
コンテンツを主体とした効率のよい「データモデルのライフサイクル」を支援するデータベース環境を確立するために、機械学習を用いたデータモデルのライフサイクルを典型的なデータ解析処理の上で評価した。オープンデータ(音楽DBやチェスログ等)や人工的データを用いて、データの時間推移による変化を表す特徴量等を抽出し、データドリフトが生じる際に保持すべきデータを削減しつつ、学習モデルの精度を担保、向上させられることを示し、「データモデルのライフサイクル」の支援の有効性について明らかにした。
|
自由記述の分野 |
情報学
|
研究成果の学術的意義や社会的意義 |
本研究では、コンテンツを主体とした効率のよい「データモデルのライフサイクル」を支援するデータベース環境を確立するために、データモデルのライフサイクルを典型的なデータ解析処理と具体的事例(オープンデータ)を用いてコンテンツ主体のデータ管理手法を設計した。 音楽配信サイトのデータと感情空間上にマッピングした音楽データベースの構築、感情空間上における音楽データベースの特徴量の有用性について解析を行った。また、機械学習コンテストで多く用いられる人工的なデータセットおよびオンラインチェスゲームのログと実データとして取り上げ、時間的な変化指標としてのモデル精度がデータ分布変化の指標として検討を行った。
|