研究課題/領域番号 |
25540140
|
研究機関 | 京都大学 |
研究代表者 |
河原 大輔 京都大学, 情報学研究科, 准教授 (10450694)
|
研究期間 (年度) |
2013-04-01 – 2016-03-31
|
キーワード | シンボルグラウンディング / 時空間情報 / メタデータ / 曖昧性解消 / 固有表現 / Webコンテンツ / ジオコーディング |
研究実績の概要 |
平成26年度は、1) 実世界参照先同定システムのプロトタイプ作成、2) メタデータ付与システムのプロトタイプ作成、3) テキスト中の固有表現の曖昧性を解消するための知識獲得を行った。それぞれについての詳細を以下で述べる。 1) 実世界参照先同定システムのプロトタイプ作成: テキスト中の固有表現に対して、それらの実世界参照先を同定するプロトタイプシステムを開発した。本システムは、テキスト中の場所表現に対して、地理座標(緯度・経度)が紐付けられたWikipediaエントリを返すものである。Twitterデータから正解データを構築、評価し、その有効性を検証した。 2) メタデータ付与システムのプロトタイプ作成: Webページを入力として、そのページを書いた著者を同定するプロトタイプシステムを開発した。本システムは、テキストの構文情報を利用することによって、高精度に著者を同定することができる。Webページに対して正解著者データが付与されたデータを用いて評価を行い、その有効性を検証した。 3) テキスト中の固有表現の曖昧性を解消するための知識獲得: 平成25年度から引き続き、動詞のクラスを同定する手法について研究を進めた。平成25年度は英語のみを対象としていたが、本年度は日本語についても対象とした。また、Freebaseなどのデータベースを利用して、固有表現の属性、属性値の情報を獲得し、それを曖昧性解消に利用することを検討した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
「研究の目的」を達成するために立てた研究計画に従い、平成26年度に実施すべきことはおおむね実施することができた。なお、平成26年度に実施予定であった項目「メタデータおよび実世界参照先の正解データの作成」は、正解データを自動構築することができたため、実施しなかった。従って、「おおむね順調に進展している。」と評価した。
|
今後の研究の推進方策 |
今後、獲得した知識を活用し、実世界参照先同定システムおよびメタデータ付与システムをより実用的に使えるものにするための開発を行う。
|
次年度使用額が生じた理由 |
年度内に予定していた研究発表の採択が遅れ、次年度になったために、次年度使用額が生じた。
|
次年度使用額の使用計画 |
次年度使用額を成果発表旅費に充当することによって、成果発表を行う。
|