2007 Fiscal Year Annual Research Report
Project/Area Number |
19700089
|
Research Institution | Nagoya Institute of Technology |
Principal Investigator |
細川 宜秀 Nagoya Institute of Technology, 工学研究科, 助教 (50312830)
|
Keywords | 空間的文脈 / 文書検索 / 意味認識 / データ・マイニング |
Research Abstract |
本年度は,文書中に出現する地名の意味を認識するための基礎となるテスト・プログラムの開発と,文書中に含まれる地名の意味を特定するのに貢献しそうな語(特徴語)の特定に関わる関連研究の調査に従事した.作成したプログラムは次の3機能群からなる:(1)文書中から抽出する特徴語として,名詞を対象とすることとし,特に複合名詞を抽出する機能,(2)建物名と住所の対集合からなる「建物名-住所名」データベースに対する検索機能,(3)(1)と(2)を組み合わせて,(文書の識別子,地名,それと共起する名詞,その出現回数)の組集合からなる文書統計データベースを構築する機能.本年度に構築するテスト・プログラムの最終目標を文書統計データベースの構築としたのは,文書に含まれる語の意味を認識するための多くの技術が語の出現頻度に基づいているためである.これは,文書検索分野,ならびに,データベース分野に対する研究発表を調査することにより得られた.特に,(1)の複合名詞抽出機能を評価実験を行いやすくできるように設計・開発を行った.これは,地名の意味の認識精度が複合名詞の抽出方法に依存することを考慮し,次年度以降の評価実験を円滑に進めるためである.本研究課題に必要なテスト・プログラムには,先に述べた機能により構築された文書統計データベースを分析する機能が必要であるが,この機能自体は,研究調査により,統計値に基づいて動作するものが多く,作成にそれほど手間がかからないので,本年度の目標であった次年度以降の検証実験を遂行するための土台構築を完遂できたと言える.本年度の研究費は,テスト・プログラム開発のための計算機環境整備と関連研究動向調査のための旅費に使用した.
|
Research Products
(1 results)