研究課題/領域番号 |
20K12557
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分90020:図書館情報学および人文社会情報学関連
|
研究機関 | 筑波大学 |
研究代表者 |
阪口 哲男 筑波大学, 図書館情報メディア系, 准教授 (10225790)
|
研究期間 (年度) |
2020-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
3,380千円 (直接経費: 2,600千円、間接経費: 780千円)
2022年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2021年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2020年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
|
キーワード | リンクトデータ / クラウドソーシング / Linked Data / Crowdsourcing / マイクロタスク / 概念間リンク / タスク自動生成 |
研究開始時の研究の概要 |
本研究は、様々な組織等が公開しているリンクトデータ(Linked Data)において、その相互運用性向上に必要な、共通する概念間のリンクをクラウドソーシングによって付与するマイクロタスクの設計と、自動生成方式を見出す。 本研究により、リンクトデータの相互運用性向上のためのクラウドソーシングの方式が確立され、リンクトデータの開発・公開やオープンデータ活動に寄与することや、マイクロタスクにリンクトデータを導入することの効果を示すことが期待できる。
|
研究実績の概要 |
本研究は、様々な組織等が公開しているリンクトデータ(Linked Data)において、その相互運用性向上に必要な、共通する概念間のリンクをクラウドソーシングによって付与するマイクロタスクの設計と、自動生成方式を見出す。本研究により、リンクトデータの相互運用性向上のためのクラウドソーシング方式が確立され、リンクトデータの開発・公開やオープンデータ活動に寄与することや、マイクロタスクにリンクトデータを導入することの効果を示すことが期待できる。 共通する概念間をリンクする候補の抽出について現時点では、人手に頼る作業をなくし、機械的な手法適用の試みとその精度評価を進めている。機械的な手法としては、リンクトデータに含まれるリテラル(文字列)の類似度を用いた場合について、実際に公開されているデータを対象にして考案したアルゴリズムの適用実験を行い、結果の精度と処理速度について評価・考察を進めて改善を進めている。その実験過程で、類似度の高いものからリンク候補を抽出しようとすると組み合わせすべてについて類似度計算を行う、いわゆる総当たり戦になり対象データセットの規模によってはある程度時間がかかることが予想された。そこで、単に類似度計算をするだけではなく、高速化のための索引付け手法の開発も行い、索引手法についてはまだ十分な精度が得られてないが、情報知識学会年次大会において口頭発表を行った。 発表後はリテラルの類似度による候補選定の次段階として必要な、そのリテラルを目的語とする述語と主語をどのように選定するかについても研究協力者と議論し、実際に公開されているリンクトデータの分析を進めており、研究期間をさらに1年延長し、成果公表を目指している。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
4: 遅れている
理由
当初計画がCOVID-19状況もあり計画通り進められなかったので、2022年度より方針を変え、機械的な処理によるものに取組んだ。その結果、ある程度実験を進めることが出来たので、その成果を情報知識学会において口頭発表した。しかしながら、その精度やリンクトデータの構造を踏まえた処理方式の考案と実験がまだ不十分であり、最終的な目標であるクラウドソーシング・タスクの自動生成に必要な知見は十分なものとは言えないため、研究期間をさらに1年延長した。
|
今後の研究の推進方策 |
機械的な手法に切り替えることで2023年度に口頭発表をすることが出来た。しかしながら、一方で機械的な手法での処理量の増大を防ぐための索引付け手法が、精度など不十分なので、最新の研究動向を調査・適用実験などを進めている。また、2023年度前半までは主にリンクトデータの目的語にあたるリテラルの類似度に関する処理を中心に進めていたので、2023年度後半よりそのリテラルを目的語とする述語や主語をどのように選定するかについて実際に公開されているリンクトデータで実験を進めており、2024年度は本研究課題の目標達成に必要な知見を見出し、成果公表を目指す。
|