2006 Fiscal Year Annual Research Report
Project/Area Number |
18680015
|
Research Institution | National Institute of Informatics |
Principal Investigator |
NIGEL Collier 国立情報学研究所, 情報学プリンシプル研究系, 助教授 (60333275)
|
Keywords | テキストマイニング / 生物地理情報 / オントロジー |
Research Abstract |
感染症に対して適切な対応を行うには、疾病発生状況の全体な把握が不可欠である。そのためには、言語により伝えられるニュースなどの情報と、生物地理マップの形で提供される視覚的な地理的・社会的情報との統合が必要であるが、これに関する研究はほとんどなされていない。そこで本研究では、テキストマイニングによりWeb上の言語情報から獲得した感染症発生イベントとその要約を、Google Earth上で表示できるプラグインモジュールを開発する。これは医療関係者による感染拡大の予測や、異常事態の検知をサポートする。 本年度は、現在開発中のテキストマイニングシステムを基盤として、以下の点に焦点を置いて研究開発を行った。 1.知識リソースの構築:(a)500のニューステキストに対して、重要な用語と関連性のアノテーションを行った。言語は英語、日本語、タイ語、ベトナム語の4ヶ国語で、テキストマイニングシステムのトレーニングに用いられる。(b)世界全体の国名、地方名などの地名の分類を行い、アジア太平洋地域の5つの国(ベトナム、中国、韓国、日本、タイ)に関しては主要な都市名もカバーした。(c)ケンブリッジ大学のグループと共同で、感染症監視に関わる情報を含む文から述語項構造フレームへのマッピングを行うパターンのセットを開発した。 2.地理オントロジー情報の統合:現在、発表されたニュース記事について、疾病と場所の統計を計算するため、地理オントロジーを使用している。プロトタイプシステムでは、時間軸上での出現頻度がプロットされるため、異常事態の発生を示唆するような動向を監視することができる。更に、このシステムではユーザがGoogle map上で場所を表示したり、Google newsで疾病名と地名のペアを使って記事検索をすることができる。現在、疫学の専門家からフィードバックを得ている。
|