関連するデータが複数のデータベースに分散しており、複数のデータベース間でやり取りしながらデータの管理を行う状況を想定してデータ共有に関する研究を推進した。データを理解し、適切な管理を行うために、データ共有の際に条件を設定して輸出入するデータをフィルタリングできることが望ましいと考え、問合せによって表現される部分データを適切に共有・更新するための仕組みを考案した。また、提案システムの実装方法について検討を行い、プロトタイプシステムの開発を行った。 研究期間全体としては、データ管理者がデータに対する理解を深めつつ効率よくデータ管理を行うための研究を実施し、具体的にはデータクリーニングとデータ共有に関する研究に取り組んだ。データクリーニングに関する研究としては、データ中の不整合な値の候補を検出し、不整合な値の候補を含む部分データを、問合せを利用したビューを用いてデータ管理者に提示することを考え、そのための不整合候補検出手法およびビュー提示手法について提案した。データ共有に関する研究としては、複数のデータ管理主体が自律分散的にデータを管理している状況において、問合せによって表現される部分データを適切に共有・更新するための仕組みを考案し、その実装方法についても提案した。 近年、機械学習を用いたデータ分析が盛んに行われているが、適切な分析のためにはデータを整備し、理解して手法を適用することが重要だと思われる。分散的にデータが生成され、管理されている場合など、一人のデータ管理者が関連するデータの全体像を把握するのが困難な状況も多いと思われるが、本研究では、問合せを用いて部分データを切り出して扱うことで、データ管理者によるデータの理解を助けながらデータ管理を行うことを考えた。
|