• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2014 年度 実施状況報告書

Webコンテンツのメタデータ自動付与に基づくシンボルグラウンディング

研究課題

研究課題/領域番号 25540140
研究機関京都大学

研究代表者

河原 大輔  京都大学, 情報学研究科, 准教授 (10450694)

研究期間 (年度) 2013-04-01 – 2016-03-31
キーワードシンボルグラウンディング / 時空間情報 / メタデータ / 曖昧性解消 / 固有表現 / Webコンテンツ / ジオコーディング
研究実績の概要

平成26年度は、1) 実世界参照先同定システムのプロトタイプ作成、2) メタデータ付与システムのプロトタイプ作成、3) テキスト中の固有表現の曖昧性を解消するための知識獲得を行った。それぞれについての詳細を以下で述べる。
1) 実世界参照先同定システムのプロトタイプ作成: テキスト中の固有表現に対して、それらの実世界参照先を同定するプロトタイプシステムを開発した。本システムは、テキスト中の場所表現に対して、地理座標(緯度・経度)が紐付けられたWikipediaエントリを返すものである。Twitterデータから正解データを構築、評価し、その有効性を検証した。
2) メタデータ付与システムのプロトタイプ作成: Webページを入力として、そのページを書いた著者を同定するプロトタイプシステムを開発した。本システムは、テキストの構文情報を利用することによって、高精度に著者を同定することができる。Webページに対して正解著者データが付与されたデータを用いて評価を行い、その有効性を検証した。
3) テキスト中の固有表現の曖昧性を解消するための知識獲得: 平成25年度から引き続き、動詞のクラスを同定する手法について研究を進めた。平成25年度は英語のみを対象としていたが、本年度は日本語についても対象とした。また、Freebaseなどのデータベースを利用して、固有表現の属性、属性値の情報を獲得し、それを曖昧性解消に利用することを検討した。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

「研究の目的」を達成するために立てた研究計画に従い、平成26年度に実施すべきことはおおむね実施することができた。なお、平成26年度に実施予定であった項目「メタデータおよび実世界参照先の正解データの作成」は、正解データを自動構築することができたため、実施しなかった。従って、「おおむね順調に進展している。」と評価した。

今後の研究の推進方策

今後、獲得した知識を活用し、実世界参照先同定システムおよびメタデータ付与システムをより実用的に使えるものにするための開発を行う。

次年度使用額が生じた理由

年度内に予定していた研究発表の採択が遅れ、次年度になったために、次年度使用額が生じた。

次年度使用額の使用計画

次年度使用額を成果発表旅費に充当することによって、成果発表を行う。

  • 研究成果

    (2件)

すべて 2014

すべて 学会発表 (2件)

  • [学会発表] ソーシャルメディアにおける空間的近接性と時間的一貫性を考慮した地名の曖昧性解消2014

    • 著者名/発表者名
      粟村 誉, 荒牧 英治, 河原 大輔, 柴田知秀, 黒橋 禎夫
    • 学会等名
      情報処理学会 第217回自然言語処理研究会
    • 発表場所
      オホーツク・文化交流センター (北海道網走市)
    • 年月日
      2014-07-04
  • [学会発表] Single Classifier Approach for Verb Sense Disambiguation based on Generalized Features2014

    • 著者名/発表者名
      Daisuke Kawahara and Martha Palmer
    • 学会等名
      In Proceedings of the 9th International Conference on Language Resources and Evaluation (LREC2014)
    • 発表場所
      Reykjavik, Iceland
    • 年月日
      2014-05-29

URL: 

公開日: 2016-06-03  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi