研究課題/領域番号 |
16K00421
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
研究分野 |
ウェブ情報学・サービス情報学
|
研究機関 | 鹿児島大学 |
研究代表者 |
渕田 孝康 鹿児島大学, 理工学域工学系, 准教授 (70253911)
|
研究期間 (年度) |
2016-10-21 – 2019-03-31
|
研究課題ステータス |
完了 (2018年度)
|
配分額 *注記 |
4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2018年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2017年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2016年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
|
キーワード | オープンデータ / 述語ベクトル / RDF / CSV / 連携可能性 / コサイン類似度 / LOD / Word2Vec / 述語ベクトル法 / 名前空間 |
研究成果の概要 |
国や地方自治体が保有するデータを公開し広く社会で活用しようというオープンデータ政策が推進されているが、現実には自治体ごとに公開しているオープンデータのフォーマットや内容が異なることから活用されていない状況が多くみられている。 本研究では国内のオープンデータの連携可能性を評価するため、RDF形式の述語に着目し、オープンデータとして公開されているCSVファイルのデータから述語ベクトルを生成し、オープンデータどうしの類似度を数値で評価する手法を提案した。 全国の約1万のオープンデータを対象に実験し、オープンデータ間の類似度をある程度数値によって表現できることを示した。
|
研究成果の学術的意義や社会的意義 |
国の方針としてオープンデータ推進政策がすすめられているが、現状では地方公共団体が公開しているオープンデータが活用されていないのが問題となっている。この問題はオープンデータの公開形式がバラバラで統一性がないことが原因の一つであると考えられる。 本研究ではこの問題を解決する方法として述語ベクトル法と呼ぶ手法を提案した。この手法はオープンデータのデータそのものに着目し、各列のデータが何を表しているかをベクトルの形で表現するものである。本手法を用いてオープンデータ間の類似度を算出し、数値でオープンデータの連携化の姓を示すことが可能となることを示した。
|