研究概要 |
我々は,これまでに,文書データに出現する地名表現をそれが指すランドマークの緯度経度に翻訳するための技術(ジオ・コーディング技術)追求を行ってきた.その技術の特徴は,空間的文脈認識を伴って地名の指すランドマークの緯度経度を自動算出することにある.ここで,空間的文脈とは,説明文を構成する語群のうち,文書に含まれる地名表現が指し示す意味(緯度経度)を特定するのに貢献する語群を表す.しかしながら,我々のジオ・コーディング技術は,ランドマークに関する知識メタデータベース(ランドマーク・メタデータベース)を前提とするため,そのメタデータベースに登録されていないランドマークの緯度経度を指す地名を含む文書データを翻訳対象外としてきた. 本研究開発では,文書データベースを対象としたランドマーク・メタデータベースを自動生成するためのシステムの実現方式を実現した.本実現方式の主要な特徴は次の点にある:文書データベースから得られるランドマーク-単語間共起関係に基づいたランドマーク・メタデータ自動生成メカニズムの実現.これにより,先行研究で実現したジオ・コーディング技術の適用範囲を拡大することが可能になる.つまり,地理空間上に自動配置可能な文書数を大幅に増大させる.実験により,本実現方式の妥当性を明らかにした.
|