• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

リンクトデータの相互運用性向上のためのクラウドソーシング・タスク自動生成の試み

Research Project

Project/Area Number 20K12557
Research Category

Grant-in-Aid for Scientific Research (C)

Allocation TypeMulti-year Fund
Section一般
Review Section Basic Section 90020:Library and information science, humanistic and social informatics-related
Research InstitutionUniversity of Tsukuba

Principal Investigator

阪口 哲男  筑波大学, 図書館情報メディア系, 准教授 (10225790)

Project Period (FY) 2020-04-01 – 2025-03-31
Project Status Granted (Fiscal Year 2023)
Budget Amount *help
¥3,380,000 (Direct Cost: ¥2,600,000、Indirect Cost: ¥780,000)
Fiscal Year 2022: ¥650,000 (Direct Cost: ¥500,000、Indirect Cost: ¥150,000)
Fiscal Year 2021: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2020: ¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000)
Keywordsリンクトデータ / クラウドソーシング / Linked Data / Crowdsourcing / マイクロタスク / 概念間リンク / タスク自動生成
Outline of Research at the Start

本研究は、様々な組織等が公開しているリンクトデータ(Linked Data)において、その相互運用性向上に必要な、共通する概念間のリンクをクラウドソーシングによって付与するマイクロタスクの設計と、自動生成方式を見出す。
本研究により、リンクトデータの相互運用性向上のためのクラウドソーシングの方式が確立され、リンクトデータの開発・公開やオープンデータ活動に寄与することや、マイクロタスクにリンクトデータを導入することの効果を示すことが期待できる。

Outline of Annual Research Achievements

本研究は、様々な組織等が公開しているリンクトデータ(Linked Data)において、その相互運用性向上に必要な、共通する概念間のリンクをクラウドソーシングによって付与するマイクロタスクの設計と、自動生成方式を見出す。本研究により、リンクトデータの相互運用性向上のためのクラウドソーシング方式が確立され、リンクトデータの開発・公開やオープンデータ活動に寄与することや、マイクロタスクにリンクトデータを導入することの効果を示すことが期待できる。
共通する概念間をリンクする候補の抽出について現時点では、人手に頼る作業をなくし、機械的な手法適用の試みとその精度評価を進めている。機械的な手法としては、リンクトデータに含まれるリテラル(文字列)の類似度を用いた場合について、実際に公開されているデータを対象にして考案したアルゴリズムの適用実験を行い、結果の精度と処理速度について評価・考察を進めて改善を進めている。その実験過程で、類似度の高いものからリンク候補を抽出しようとすると組み合わせすべてについて類似度計算を行う、いわゆる総当たり戦になり対象データセットの規模によってはある程度時間がかかることが予想された。そこで、単に類似度計算をするだけではなく、高速化のための索引付け手法の開発も行い、索引手法についてはまだ十分な精度が得られてないが、情報知識学会年次大会において口頭発表を行った。
発表後はリテラルの類似度による候補選定の次段階として必要な、そのリテラルを目的語とする述語と主語をどのように選定するかについても研究協力者と議論し、実際に公開されているリンクトデータの分析を進めており、研究期間をさらに1年延長し、成果公表を目指している。

Current Status of Research Progress
Current Status of Research Progress

4: Progress in research has been delayed.

Reason

当初計画がCOVID-19状況もあり計画通り進められなかったので、2022年度より方針を変え、機械的な処理によるものに取組んだ。その結果、ある程度実験を進めることが出来たので、その成果を情報知識学会において口頭発表した。しかしながら、その精度やリンクトデータの構造を踏まえた処理方式の考案と実験がまだ不十分であり、最終的な目標であるクラウドソーシング・タスクの自動生成に必要な知見は十分なものとは言えないため、研究期間をさらに1年延長した。

Strategy for Future Research Activity

機械的な手法に切り替えることで2023年度に口頭発表をすることが出来た。しかしながら、一方で機械的な手法での処理量の増大を防ぐための索引付け手法が、精度など不十分なので、最新の研究動向を調査・適用実験などを進めている。また、2023年度前半までは主にリンクトデータの目的語にあたるリテラルの類似度に関する処理を中心に進めていたので、2023年度後半よりそのリテラルを目的語とする述語や主語をどのように選定するかについて実際に公開されているリンクトデータで実験を進めており、2024年度は本研究課題の目標達成に必要な知見を見出し、成果公表を目指す。

Report

(4 results)
  • 2023 Research-status Report
  • 2022 Research-status Report
  • 2021 Research-status Report
  • 2020 Research-status Report
  • Research Products

    (2 results)

All 2023

All Journal Article (1 results) (of which Open Access: 1 results) Presentation (1 results)

  • [Journal Article] Attempt to Recommend LOD Link Candidates Using Literal Similarity2023

    • Author(s)
      関口 賢, 阪口 哲男
    • Journal Title

      Joho Chishiki Gakkaishi

      Volume: 33 Issue: 2 Pages: 174-179

    • DOI

      10.2964/jsik_2023_014

    • ISSN
      0917-1436, 1881-7661
    • Year and Date
      2023-05-20
    • Related Report
      2023 Research-status Report
    • Open Access
  • [Presentation] リテラルの類似度を用いたLODリンク候補推薦の試み2023

    • Author(s)
      関口 賢, 阪口 哲男
    • Organizer
      情報知識学会
    • Related Report
      2023 Research-status Report

URL: 

Published: 2020-04-28   Modified: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi