研究課題/領域番号 |
20K12557
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分90020:図書館情報学および人文社会情報学関連
|
研究機関 | 筑波大学 |
研究代表者 |
阪口 哲男 筑波大学, 図書館情報メディア系, 准教授 (10225790)
|
研究期間 (年度) |
2020-04-01 – 2024-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
3,380千円 (直接経費: 2,600千円、間接経費: 780千円)
2022年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2021年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2020年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
|
キーワード | リンクトデータ / クラウドソーシング / Linked Data / Crowdsourcing / マイクロタスク / 概念間リンク / タスク自動生成 |
研究開始時の研究の概要 |
本研究は、様々な組織等が公開しているリンクトデータ(Linked Data)において、その相互運用性向上に必要な、共通する概念間のリンクをクラウドソーシングによって付与するマイクロタスクの設計と、自動生成方式を見出す。 本研究により、リンクトデータの相互運用性向上のためのクラウドソーシングの方式が確立され、リンクトデータの開発・公開やオープンデータ活動に寄与することや、マイクロタスクにリンクトデータを導入することの効果を示すことが期待できる。
|
研究実績の概要 |
本研究は、様々な組織等が公開しているリンクトデータ(Linked Data)において、その相互運用性向上に必要な、共通する概念間のリンクをクラウドソーシングによって付与するマイクロタスクの設計と、自動生成方式を見出す。本研究により、リンクトデータの相互運用性向上のためのクラウドソーシング方式が確立され、リンクトデータの開発・公開やオープンデータ活動に寄与することや、マイクロタスクにリンクトデータを導入することの効果を示すことが期待できる。 共通する概念間をリンクする候補の抽出について2021年度までと方針を変え、人手に頼る作業をなくし、機械的な手法適用の試みとその精度評価を進めている。機械的な手法としては、リンクトデータに含まれるリテラル(文字列)の類似度を用いた場合について、実際に公開されているデータを対象にして考案したアルゴリズムの適用実験を行い、結果の精度と処理速度について評価・考察を進めて改善を進めている。その実験過程で、類似度の高いものからリンク候補を抽出しようとすると組み合わせすべてについて類似度計算を行う、いわゆる総当たり戦になり対象データセットの規模によってはある程度時間がかかることが予想された。そこで、単に類似度計算をするだけではなく、高速化のための索引付け手法の開発についても着手している。本実験の結果については、2022年度中の学会発表等には間に合わなかったが、2023年度での発表を計画している。 関連研究や最新動向などの情報収集について、依然COVID-19の影響によりオンライン開催で参加費無料のものが多く出張経費等もほぼかからなかった。また、本年度行った実験についても特に新規機材を必要としなかった。一方、学会などでの発表を行うためと、2022年度に進めた内容をより発展させる必要もあり、研究期間の1年延長を申請した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
4: 遅れている
理由
2021年度までは人手によるデータ整理等の作業がCOVID-19状況で計画通り進められず、研究がなかなか進められなかったため、2022年度は方針を変え、機械的な処理によるものに取組んだ。その結果、ある程度実験を進めることが出来たので、その成果を学会発表するべく準備を進めている。しかしながら、最終的な目標であるクラウドソーシング・タスクの自動生成に必要な知見は十分なものとは言えないため、研究期間を1年延長した。
|
今後の研究の推進方策 |
前年度の検討に従って、機械的な手法に切り替えることで2022年度はある程度研究を進めることが出来た。2023年度もこの方針で進めるが、一方で機械的な手法では処理量の増大をいかに防ぐかが課題となることがわかってきたので、索引付けなど最新の研究動向を調査しつつ、本研究課題の目標達成に求められる知見を見出していく。
|