• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

政府・自治体オープンデータの公開と検索の支援を目的としたタグ付与に関する研究

研究課題

研究課題/領域番号 19K12715
研究種目

基盤研究(C)

配分区分基金
応募区分一般
審査区分 小区分90020:図書館情報学および人文社会情報学関連
研究機関島根大学

研究代表者

山田 泰寛  島根大学, 学術研究院理工学系, 助教 (50529609)

研究期間 (年度) 2019-04-01 – 2024-03-31
研究課題ステータス 完了 (2023年度)
配分額 *注記
2,470千円 (直接経費: 1,900千円、間接経費: 570千円)
2021年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2020年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2019年度: 520千円 (直接経費: 400千円、間接経費: 120千円)
キーワードオープンデータ / テキストマイニング / タグ推薦 / 機械学習
研究開始時の研究の概要

近年,政府や地方自治体が保有する統計データをWeb上に公開する動きが広がっている.このようなデータはオープンデータと呼ばれる.オープンデータを公開する際には,データの内容を表わす語であるタグが付与される.本研究は,政府や自治体がオープンデータを公開する際の支援と,利用者がオープンデータを検索する際の支援を目的として,オープンデータに対してタグを自動付与する手法の開発を行う.

研究成果の概要

本研究は,政府がWeb上で公開している統計データ(オープンデータ呼ぶ)に対して,データセットの内容を表わす語であるタグ(ラベル)を自動で付与することを目的としている.1個のデータセットに対して複数のラベルを付与する手法であるマルチラベル分類を用いて,特に学習データにおいて出現回数の少ないラベルに着目し,それを付与することを目指している.
1個のデータセットにおいて,複数のラベルが同時に出現することを利用して,出現回数の少ないラベルの学習データを増やすオーバーサンプリング手法を提案した.また,オープンデータのタイトルや説明を入力として与えたとき,付与すべきタグを推薦するシステムの開発を行なった.

研究成果の学術的意義や社会的意義

学習データにおいて出現回数の少ないタグは推薦されにくいという問題に対して,疑似的にそれらの学習データを増やす手法を開発した.また,オープンデータのタイトルや説明を入力したとき,そのオープンデータに対して付与すべきタグを推薦するシステムを開発した.オープンデータを公開する際に,ふさわしいタグを付与することの一助となることが期待できる.また,付与されたタグがオープンデータの検索の際にも役立つことが期待できる.

報告書

(6件)
  • 2023 実績報告書   研究成果報告書 ( PDF )
  • 2022 実施状況報告書
  • 2021 実施状況報告書
  • 2020 実施状況報告書
  • 2019 実施状況報告書
  • 研究成果

    (5件)

すべて 2023 2022 その他

すべて 雑誌論文 (2件) (うち査読あり 1件) 学会発表 (2件) (うち国際学会 1件) 備考 (1件)

  • [雑誌論文] Tag Recommendation System for Data Catalog Site of Japanese Government2023

    • 著者名/発表者名
      Yamada Yasuhiro
    • 雑誌名

      Proceedings of the 15th International Joint Conference on Knowledge Discovery, Knowledge Engineering and Knowledge Management (IC3K 2023)

      巻: 3: KMIS ページ: 325-331

    • DOI

      10.5220/0012260000003598

    • 関連する報告書
      2023 実績報告書
    • 査読あり
  • [雑誌論文] 政府オープンデータにおける少数ラベルの推定2022

    • 著者名/発表者名
      河野湧芽,山田泰寛
    • 雑誌名

      2022年度(第73回)電気・情報関連学会中国支部連合大会

      巻: -

    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] Tag Recommendation System for Data Catalog Site of Japanese Government2023

    • 著者名/発表者名
      Yamada Yasuhiro
    • 学会等名
      15th International Joint Conference on Knowledge Discovery, Knowledge Engineering and Knowledge Management (IC3K 2023)
    • 関連する報告書
      2023 実績報告書
    • 国際学会
  • [学会発表] 政府オープンデータにおける少数ラベルの推定2022

    • 著者名/発表者名
      河野湧芽
    • 学会等名
      2022 年度(第73 回)電気・情報関連学会中国支部連合大会
    • 関連する報告書
      2022 実施状況報告書
  • [備考] 政府・自治体オープンデータ・タグ推薦システム

    • URL

      http://buti.cis.shimane-u.ac.jp/

    • 関連する報告書
      2022 実施状況報告書

URL: 

公開日: 2019-04-18   更新日: 2025-11-20  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi