研究課題/領域番号 |
18K11318
|
研究機関 | 津田塾大学 |
研究代表者 |
中野 美由紀 津田塾大学, 学芸学部, 教授 (30227863)
|
研究期間 (年度) |
2018-04-01 – 2022-03-31
|
キーワード | データベース / データモデルライフサイクル / 機械学習 / 統計解析 / データ解析 |
研究実績の概要 |
本研究では、コンテンツを主体とした効率のよい「データモデルのライフサイクル」を支援するデータベース環境を確立するために、データモデルのライフサイクルを典型的なデータ解析処理(単純ベイズ、クラスタリング、深層学習等)と具体的事例(政府統計データ、オープンデータ)を用いてコンテンツ主体のデータ管理手法を設計し、「データモデルのライフサイクル」の支援の有効性について具体的事例を基に検討する。初年度から行っている「データモデルのライフサイクル」および「知識発見プロセス」の過程からコンテンツと共にあるべきログ情報(クレンジングの過程、特徴量抽出や学習過程等)およびライブラリィ情報(処理アルゴリズム、最終の予測・推定モデル等)に関する検討を行うための、実験環境の準備、整備を行い、予備実験として簡単なアプリケーションを構築を引き続き継続すると共に、得られた知見を基に機械学習のモデル・ルールのライフサイクルあるいは持続的な運用を支援するデータ基盤としての機能(モデルが利用するデータ群および特徴量、構築に用いられたデータログ、データ変化の統計量の保持・更新)について検討を行った。 昨年度は主として新曲が多く発表される音楽を対象に、音楽配信サイトのデータを利用し、感情空間上にマッピングした音楽データベースの構築を行い、感情空間上における音楽データベースの特徴量の有用性について解析を行った。また、この感情空間上の音楽データベースを利用した音楽推薦システムを構築し、推薦のためのモデルを対象に、モデルのライフサイクルとして、人気度による時間的変動についての解析実験を行いを詳細に行い、ユーザ嗜好と合わせてモデルの精度との関連を記録するためのデータベースにおけるデータ変化の定量的指標に向けての検討を行った。また、短期間スケジュール推薦システムを構築し、短期間で変動するウェブ上のデータの変化を追跡した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
データ解析とあわせて、モデルの精度の変化および関連したデータの変化のログ収集のフレームワークを設計した。
|
今後の研究の推進方策 |
音楽推薦システム、スケジュール推薦システムなどの異なるデータを用いたモデル・ルールを利用することで、さらなるデータ変化とモデル変化の関連性を明らかにし、機械学習のモデル・ルールのライフサイクルあるいは持続的な運用を支援するデータ基盤のフレームワークを確定する。
|
次年度使用額が生じた理由 |
新型コロナ感染のため、学会発表のための旅費が不要、また、学生の参加費(オンライン参加)が各学会とも無料となったため
|