2014 Fiscal Year Research-status Report
Webコンテンツのメタデータ自動付与に基づくシンボルグラウンディング
Project/Area Number |
25540140
|
Research Institution | Kyoto University |
Principal Investigator |
河原 大輔 京都大学, 情報学研究科, 准教授 (10450694)
|
Project Period (FY) |
2013-04-01 – 2016-03-31
|
Keywords | シンボルグラウンディング / 時空間情報 / メタデータ / 曖昧性解消 / 固有表現 / Webコンテンツ / ジオコーディング |
Outline of Annual Research Achievements |
平成26年度は、1) 実世界参照先同定システムのプロトタイプ作成、2) メタデータ付与システムのプロトタイプ作成、3) テキスト中の固有表現の曖昧性を解消するための知識獲得を行った。それぞれについての詳細を以下で述べる。 1) 実世界参照先同定システムのプロトタイプ作成: テキスト中の固有表現に対して、それらの実世界参照先を同定するプロトタイプシステムを開発した。本システムは、テキスト中の場所表現に対して、地理座標(緯度・経度)が紐付けられたWikipediaエントリを返すものである。Twitterデータから正解データを構築、評価し、その有効性を検証した。 2) メタデータ付与システムのプロトタイプ作成: Webページを入力として、そのページを書いた著者を同定するプロトタイプシステムを開発した。本システムは、テキストの構文情報を利用することによって、高精度に著者を同定することができる。Webページに対して正解著者データが付与されたデータを用いて評価を行い、その有効性を検証した。 3) テキスト中の固有表現の曖昧性を解消するための知識獲得: 平成25年度から引き続き、動詞のクラスを同定する手法について研究を進めた。平成25年度は英語のみを対象としていたが、本年度は日本語についても対象とした。また、Freebaseなどのデータベースを利用して、固有表現の属性、属性値の情報を獲得し、それを曖昧性解消に利用することを検討した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
「研究の目的」を達成するために立てた研究計画に従い、平成26年度に実施すべきことはおおむね実施することができた。なお、平成26年度に実施予定であった項目「メタデータおよび実世界参照先の正解データの作成」は、正解データを自動構築することができたため、実施しなかった。従って、「おおむね順調に進展している。」と評価した。
|
Strategy for Future Research Activity |
今後、獲得した知識を活用し、実世界参照先同定システムおよびメタデータ付与システムをより実用的に使えるものにするための開発を行う。
|
Causes of Carryover |
年度内に予定していた研究発表の採択が遅れ、次年度になったために、次年度使用額が生じた。
|
Expenditure Plan for Carryover Budget |
次年度使用額を成果発表旅費に充当することによって、成果発表を行う。
|