研究課題/領域番号 |
18K11318
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分60080:データベース関連
|
研究機関 | 津田塾大学 (2019-2022) 産業技術大学院大学 (2018) |
研究代表者 |
中野 美由紀 津田塾大学, 学芸学部, 教授 (30227863)
|
研究期間 (年度) |
2018-04-01 – 2023-03-31
|
研究課題ステータス |
完了 (2022年度)
|
配分額 *注記 |
3,900千円 (直接経費: 3,000千円、間接経費: 900千円)
2021年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2020年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2019年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2018年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
|
キーワード | データ解析 / データベース・システム / データ流通 / データのライフサイクル / 機械学習 / データベース / データモデル・ライフサイクル / 統計解析 / データモデルライフサイクル / データ貝瀬kい / 予測モデル / ライフサイクル / コンテンツ指向 / データベースシステム |
研究成果の概要 |
コンテンツを主体とした効率のよい「データモデルのライフサイクル」を支援するデータベース環境を確立するために、機械学習を用いたデータモデルのライフサイクルを典型的なデータ解析処理の上で評価した。オープンデータ(音楽DBやチェスログ等)や人工的データを用いて、データの時間推移による変化を表す特徴量等を抽出し、データドリフトが生じる際に保持すべきデータを削減しつつ、学習モデルの精度を担保、向上させられることを示し、「データモデルのライフサイクル」の支援の有効性について明らかにした。
|
研究成果の学術的意義や社会的意義 |
本研究では、コンテンツを主体とした効率のよい「データモデルのライフサイクル」を支援するデータベース環境を確立するために、データモデルのライフサイクルを典型的なデータ解析処理と具体的事例(オープンデータ)を用いてコンテンツ主体のデータ管理手法を設計した。 音楽配信サイトのデータと感情空間上にマッピングした音楽データベースの構築、感情空間上における音楽データベースの特徴量の有用性について解析を行った。また、機械学習コンテストで多く用いられる人工的なデータセットおよびオンラインチェスゲームのログと実データとして取り上げ、時間的な変化指標としてのモデル精度がデータ分布変化の指標として検討を行った。
|