• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2009 年度 実績報告書

文書データに出現する地名の意味認識システムの研究

研究課題

研究課題/領域番号 19700089
研究機関群馬大学

研究代表者

細川 宜秀  群馬大学, 大学院・工学研究科, 講師 (50312830)

キーワード空間的文脈 / 意味認識 / 文書検索 / 位置情報システム
研究概要

本研究課題は,緯度経度と関連付けられていないが,地名を含む文書データに,その地名が指す緯度経度(地名の意味)を自動認識し,それを含む文書に付与するための技術開発を行うものである.現在,インターネット上には,地名を含むが緯度経度が関連付けられていない文書データが数多く存在しているが,それらに緯度経度を付与できれば,モバイル・ユビキタス・ネットワーグ環境における場所に応じた文書活用機会を大幅に向上させることが可能になる.
本年度は,文書中に出現する地名の意味を認識するためのプログラム開発,正解データと照合しその正解率を算出するための補助ソフトウェア,ならびに,正解データの作成を行った.作成したプログラムとは,新聞記事において,ランドマークと共起する単語群の統計情報収集,ならびに,収集した情報を元に,ILF(Inverse Landmark Frequency)という提案指標に基づいて,ランドマークの特徴を表す語の自動判別,ならびに,その特徴量算出を行うものである.ここでILFとは,複数のランドマークの特徴になりえる語の特徴量を減じる効果をもたらすものである.
文書に含まれる地名の意味認識機能の精度を計測すべく,本研究開発において作成した提案システムと,文書検索分野における既存の語の特徴量算出に基づく比較対象システム,さらに,ILFと既存手法を組み合わせた計8システムを実装し,それらの意味認識精度の比較を行った.その結果,ILFと既存手法を組み合わせた方式が最も高性能(80%を超える意味認識率)であり,提案方式の妥当性を明らかにした.
本年度の研究費は,特に,8システムの比較評価において,多数の文書解析処理を必要とすることから,その時間軽減のために,各システムの性能評価を行うための複数台のパソコン購入に充てた.さらに,その成果発表のための旅費に使用した.

  • 研究成果

    (3件)

すべて 2010

すべて 学会発表 (3件)

  • [学会発表] 新聞記事データベースを対象とした空間的文脈認識を伴うジオ・コーディングのためのランドマーク・メタデータベースの自動生成機能の実現方式2010

    • 著者名/発表者名
      細川宜秀
    • 学会等名
      電子情報通信学会 第2回データ工学と情報マネジメントに関するフォーラム
    • 発表場所
      淡路夢舞台国際会議場(兵庫県淡路市)
    • 年月日
      2010-03-01
  • [学会発表] 地図への文書自動配置機能の地域内情報発信システムへの適性評価2010

    • 著者名/発表者名
      細川宜秀
    • 学会等名
      電子情報通信学会 第2回データ工学と情報マネジメントに関するフォーラム
    • 発表場所
      淡路夢舞台国際会議場(兵庫県淡路市)
    • 年月日
      2010-03-01
  • [学会発表] 空間的関係の近似化を伴う周辺情報提示機構の実現方式2010

    • 著者名/発表者名
      中澤優一郎
    • 学会等名
      電子情報通信学会 第2回データ工学と情報マネジメントに関するフォーラム
    • 発表場所
      淡路夢舞台国際会議場(兵庫県淡路市)
    • 年月日
      2010-02-28

URL: 

公開日: 2011-06-16   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi