2023 Fiscal Year Research-status Report
リンクトデータの相互運用性向上のためのクラウドソーシング・タスク自動生成の試み
Project/Area Number |
20K12557
|
Research Institution | University of Tsukuba |
Principal Investigator |
阪口 哲男 筑波大学, 図書館情報メディア系, 准教授 (10225790)
|
Project Period (FY) |
2020-04-01 – 2025-03-31
|
Keywords | リンクトデータ / クラウドソーシング / Linked Data / Crowdsourcing |
Outline of Annual Research Achievements |
本研究は、様々な組織等が公開しているリンクトデータ(Linked Data)において、その相互運用性向上に必要な、共通する概念間のリンクをクラウドソーシングによって付与するマイクロタスクの設計と、自動生成方式を見出す。本研究により、リンクトデータの相互運用性向上のためのクラウドソーシング方式が確立され、リンクトデータの開発・公開やオープンデータ活動に寄与することや、マイクロタスクにリンクトデータを導入することの効果を示すことが期待できる。 共通する概念間をリンクする候補の抽出について現時点では、人手に頼る作業をなくし、機械的な手法適用の試みとその精度評価を進めている。機械的な手法としては、リンクトデータに含まれるリテラル(文字列)の類似度を用いた場合について、実際に公開されているデータを対象にして考案したアルゴリズムの適用実験を行い、結果の精度と処理速度について評価・考察を進めて改善を進めている。その実験過程で、類似度の高いものからリンク候補を抽出しようとすると組み合わせすべてについて類似度計算を行う、いわゆる総当たり戦になり対象データセットの規模によってはある程度時間がかかることが予想された。そこで、単に類似度計算をするだけではなく、高速化のための索引付け手法の開発も行い、索引手法についてはまだ十分な精度が得られてないが、情報知識学会年次大会において口頭発表を行った。 発表後はリテラルの類似度による候補選定の次段階として必要な、そのリテラルを目的語とする述語と主語をどのように選定するかについても研究協力者と議論し、実際に公開されているリンクトデータの分析を進めており、研究期間をさらに1年延長し、成果公表を目指している。
|
Current Status of Research Progress |
Current Status of Research Progress
4: Progress in research has been delayed.
Reason
当初計画がCOVID-19状況もあり計画通り進められなかったので、2022年度より方針を変え、機械的な処理によるものに取組んだ。その結果、ある程度実験を進めることが出来たので、その成果を情報知識学会において口頭発表した。しかしながら、その精度やリンクトデータの構造を踏まえた処理方式の考案と実験がまだ不十分であり、最終的な目標であるクラウドソーシング・タスクの自動生成に必要な知見は十分なものとは言えないため、研究期間をさらに1年延長した。
|
Strategy for Future Research Activity |
機械的な手法に切り替えることで2023年度に口頭発表をすることが出来た。しかしながら、一方で機械的な手法での処理量の増大を防ぐための索引付け手法が、精度など不十分なので、最新の研究動向を調査・適用実験などを進めている。また、2023年度前半までは主にリンクトデータの目的語にあたるリテラルの類似度に関する処理を中心に進めていたので、2023年度後半よりそのリテラルを目的語とする述語や主語をどのように選定するかについて実際に公開されているリンクトデータで実験を進めており、2024年度は本研究課題の目標達成に必要な知見を見出し、成果公表を目指す。
|
Causes of Carryover |
本来であれば本研究課題は2022年度で終了するはずであったが、研究全体が計画に対して遅れている。2021年度に検討した研究方針の転換と研究期間延長により、ある程度進捗を得たが2023年度は中間的な成果公表にとどまっている。そこで研究期間をさらに1年延長し、実際に公開されているリンクトデータを用いて、リンクトデータ特有の性質も含めた実験を進め、それらの成果の発表を目指す。
|
Research Products
(2 results)