Project/Area Number |
20K12557
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 90020:Library and information science, humanistic and social informatics-related
|
Research Institution | University of Tsukuba |
Principal Investigator |
阪口 哲男 筑波大学, 図書館情報メディア系, 准教授 (10225790)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Project Status |
Granted (Fiscal Year 2022)
|
Budget Amount *help |
¥3,380,000 (Direct Cost: ¥2,600,000、Indirect Cost: ¥780,000)
Fiscal Year 2022: ¥650,000 (Direct Cost: ¥500,000、Indirect Cost: ¥150,000)
Fiscal Year 2021: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2020: ¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000)
|
Keywords | リンクトデータ / クラウドソーシング / Linked Data / Crowdsourcing / マイクロタスク / 概念間リンク / タスク自動生成 |
Outline of Research at the Start |
本研究は、様々な組織等が公開しているリンクトデータ(Linked Data)において、その相互運用性向上に必要な、共通する概念間のリンクをクラウドソーシングによって付与するマイクロタスクの設計と、自動生成方式を見出す。 本研究により、リンクトデータの相互運用性向上のためのクラウドソーシングの方式が確立され、リンクトデータの開発・公開やオープンデータ活動に寄与することや、マイクロタスクにリンクトデータを導入することの効果を示すことが期待できる。
|
Outline of Annual Research Achievements |
本研究は、様々な組織等が公開しているリンクトデータ(Linked Data)において、その相互運用性向上に必要な、共通する概念間のリンクをクラウドソーシングによって付与するマイクロタスクの設計と、自動生成方式を見出す。本研究により、リンクトデータの相互運用性向上のためのクラウドソーシング方式が確立され、リンクトデータの開発・公開やオープンデータ活動に寄与することや、マイクロタスクにリンクトデータを導入することの効果を示すことが期待できる。 共通する概念間をリンクする候補の抽出について2021年度までと方針を変え、人手に頼る作業をなくし、機械的な手法適用の試みとその精度評価を進めている。機械的な手法としては、リンクトデータに含まれるリテラル(文字列)の類似度を用いた場合について、実際に公開されているデータを対象にして考案したアルゴリズムの適用実験を行い、結果の精度と処理速度について評価・考察を進めて改善を進めている。その実験過程で、類似度の高いものからリンク候補を抽出しようとすると組み合わせすべてについて類似度計算を行う、いわゆる総当たり戦になり対象データセットの規模によってはある程度時間がかかることが予想された。そこで、単に類似度計算をするだけではなく、高速化のための索引付け手法の開発についても着手している。本実験の結果については、2022年度中の学会発表等には間に合わなかったが、2023年度での発表を計画している。 関連研究や最新動向などの情報収集について、依然COVID-19の影響によりオンライン開催で参加費無料のものが多く出張経費等もほぼかからなかった。また、本年度行った実験についても特に新規機材を必要としなかった。一方、学会などでの発表を行うためと、2022年度に進めた内容をより発展させる必要もあり、研究期間の1年延長を申請した。
|
Current Status of Research Progress |
Current Status of Research Progress
4: Progress in research has been delayed.
Reason
2021年度までは人手によるデータ整理等の作業がCOVID-19状況で計画通り進められず、研究がなかなか進められなかったため、2022年度は方針を変え、機械的な処理によるものに取組んだ。その結果、ある程度実験を進めることが出来たので、その成果を学会発表するべく準備を進めている。しかしながら、最終的な目標であるクラウドソーシング・タスクの自動生成に必要な知見は十分なものとは言えないため、研究期間を1年延長した。
|
Strategy for Future Research Activity |
前年度の検討に従って、機械的な手法に切り替えることで2022年度はある程度研究を進めることが出来た。2023年度もこの方針で進めるが、一方で機械的な手法では処理量の増大をいかに防ぐかが課題となることがわかってきたので、索引付けなど最新の研究動向を調査しつつ、本研究課題の目標達成に求められる知見を見出していく。
|