2018 Fiscal Year Research-status Report
大規模データ分析のための多視点分析管理システムの研究開発
Project/Area Number |
18K18056
|
Research Institution | Nagoya University |
Principal Investigator |
駒水 孝裕 名古屋大学, 情報基盤センター, 助教 (30756367)
|
Project Period (FY) |
2018-04-01 – 2021-03-31
|
Keywords | Linked Open Data / Entity Search / Entity Linking / PagaRank / Random Walk with Restart |
Outline of Annual Research Achievements |
今年度における本研究課題では,外部知識と結びつけを行うためのエンティティリンキングに関する研究を推進した. エンティティリンキングにおいて,対象となるキーワードがどのエンティティにマッチするかを判定することが必須である.特に,キーワードが間接的な表現になっている場合にはエンティティリンキングは難しくなる.この点に対処するために,本研究では,エンティティ検索タスクに取り組んだ.まず既存手法の問題点を評価指標の観点から指摘し,明らかにした問題点に対して有効な方策を提案した.既存手法では入力キーワードに対して発見が本質的に困難なエンティティがあることを問題点として示した.この問題に対し,エンティティの存在する知識グラフのグラフ構造を有効に活用した方策 RWRDoc を提案した.具体的には,Random Walk with Restart (RWR) を用いてエンティティに「関連するテキスト」の獲得を行い,獲得したテキストに対して検索する,この手法を導入した結果,検索結果エンティティの見落としを低減することに成功した.一方で,この提案手法は,見落としを軽減することはできたものの,検索結果エンティティのランキング性能としてはあまり高くない,という難点があった.この弱点に対し,知識グラフのトポロジー情報を活用した再ランキング手法 PPRSD (Personalized Page Rank-based Score Distribution) を提案した.この手法では,テキストベースの検索結果スコアを反映しつつ,グラフ構造上で重要なエンティティに高いスコアを分配する.これにより,RWRDocの持っていた弱点を解消し,既存研究よりも高い検索性能を達成した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究課題における研究課題の一つであるエンティティリンキングに関する研究を進めた. 上記のように,対象となるキーワードに対し対応するエンティティを発見するという目的は十分に達成できていると考えられる.エンティティリンキングにおいて重要である再現率重視の手法を構築し,その上で適合率を向上させる手法を組み合わせた.この組み合わせにより,既存研究よりも高い検索性能を達成した.これらのことから本研究課題が概ね順調に進展していると自己評価する.
|
Strategy for Future Research Activity |
今年度の積み残しとなった機能要件や性能要件の実現に向けた研究を進めるとともに,多視点分析の自動化に関する実現方式の検討を本格化する. 多視点分析の自動化については,既存の研究をベースにより高度な分析の実現方法の検討を進める.また,同時に自動分析の高速化についても検討を進める.また,最終年度を意識し,エンティティリンキングと自動分析結果の結合方針についても検討を始めていく.
|
Causes of Carryover |
当初想定したい以上に研究成果発表のための国際会議参加が発生し,旅費に想定以上の出費が発生した.それに伴い,物品費を予定より減額せざるを得なくなり,物品の購入を見送った.そのため,旅費およびその他の経費が予定額を上回り,物品費が予定額を下回ったため全体として予定学を下回った. 多視点分析の自動化に関して国際会議での成果発表を今年度予定している.次年度使用額はこれに充填する予定である.
|