• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2007 年度 実績報告書

文書データに出現する地名の意味認識システムの研究

研究課題

研究課題/領域番号 19700089
研究機関名古屋工業大学

研究代表者

細川 宜秀  名古屋工業大学, 工学研究科, 助教 (50312830)

キーワード空間的文脈 / 文書検索 / 意味認識 / データ・マイニング
研究概要

本年度は,文書中に出現する地名の意味を認識するための基礎となるテスト・プログラムの開発と,文書中に含まれる地名の意味を特定するのに貢献しそうな語(特徴語)の特定に関わる関連研究の調査に従事した.作成したプログラムは次の3機能群からなる:(1)文書中から抽出する特徴語として,名詞を対象とすることとし,特に複合名詞を抽出する機能,(2)建物名と住所の対集合からなる「建物名-住所名」データベースに対する検索機能,(3)(1)と(2)を組み合わせて,(文書の識別子,地名,それと共起する名詞,その出現回数)の組集合からなる文書統計データベースを構築する機能.本年度に構築するテスト・プログラムの最終目標を文書統計データベースの構築としたのは,文書に含まれる語の意味を認識するための多くの技術が語の出現頻度に基づいているためである.これは,文書検索分野,ならびに,データベース分野に対する研究発表を調査することにより得られた.特に,(1)の複合名詞抽出機能を評価実験を行いやすくできるように設計・開発を行った.これは,地名の意味の認識精度が複合名詞の抽出方法に依存することを考慮し,次年度以降の評価実験を円滑に進めるためである.本研究課題に必要なテスト・プログラムには,先に述べた機能により構築された文書統計データベースを分析する機能が必要であるが,この機能自体は,研究調査により,統計値に基づいて動作するものが多く,作成にそれほど手間がかからないので,本年度の目標であった次年度以降の検証実験を遂行するための土台構築を完遂できたと言える.本年度の研究費は,テスト・プログラム開発のための計算機環境整備と関連研究動向調査のための旅費に使用した.

  • 研究成果

    (1件)

すべて 2007

すべて 産業財産権 (1件)

  • [産業財産権] ランドマーク検索装置、情報検索システム、情報生成装置、及び情報配信システム2007

    • 発明者名
      細川宜秀, 高橋直久
    • 権利者名
      細川宜秀, 高橋直久
    • 産業財産権番号
      特許 2004-159697
    • 取得年月日
      2007-12-07

URL: 

公開日: 2010-02-04   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi