伝染病から社会を守るための知的な伝染病追跡システム
Project/Area Number |
18049071
|
Research Category |
Grant-in-Aid for Scientific Research on Priority Areas
|
Allocation Type | Single-year Grants |
Review Section |
Science and Engineering
|
Research Institution | National Institute of Informatics |
Principal Investigator |
NIGEL Collier 国立情報学研究所, 情報学プリンシプル研究系, 助教授 (60333275)
|
Project Period (FY) |
2006
|
Project Status |
Completed (Fiscal Year 2006)
|
Budget Amount *help |
¥6,000,000 (Direct Cost: ¥6,000,000)
Fiscal Year 2006: ¥6,000,000 (Direct Cost: ¥6,000,000)
|
Keywords | テキストマイニング / 伝染病追跡 |
Research Abstract |
初年度は、自然言語処理ツールを基にしたテキストマイニングシステムをバックエンドに持つ、BioCaster Webポータルのプロトタイプを完成した。概要を以下に記す。 1)人手による生物医学用語アノテーションスキーマの開発 疫学者は主に、疾病の発生する環境や、疾病の蔓延、社会の認識、抑制活動に影響する諸要因に関心を持っている。研究の初期段階で、国立感染症研究所の専門家との意見交換により、Web上のニュースからの情報収集におけるいくつかの共通シナリオの存在が明らかになった。薬品、疾病、ウイルス等の概念カテゴリのリストからオントロジーを構築し、これらのカテゴリを基にニュース記事の用語をアノテーションするためのガイドラインを開発した。博士課程の学生を2人雇用し、500のニュース記事をアノテーションした。このコーパスをもとに、SVMを用いて専門用語の認識学習を行い、SVMおよびCRFによる10分割交差検定による実験を行った。 2)英語、日本語、タイ語、ベトナム語による専門用語認識システムの開発 日本語、タイ語、ベトナム語のテキストマイニングモジュールの開発においては、専門用語認識やコーパス構築に焦点をあてた。岡山大学(竹内講師)、カセサート大学(カートラクル教授)、ベトナム国立大学ホーチミン校(ディエン教授)のグループと共同で、ニュース記事の4ヶ国語並列コーパスに対する評価を行った。この研究のためにディエン教授をNIIに招聘し、共同開発を行った。 SVMとCRFでの10分割交差検定の後、言語内および言語間でのタグ付け結果の比較を行った。この結果は主要な生物情報学術誌に投稿中である。 3)記事検索のためのプロトタイプWebポータルの開発 Apache、PHP、MySQLを使用してWebポータルを実装し、国立感染症研究所の疫学の専門家がタグ付け・分類済みのニュース記事にアクセスできるようにした。
|
Report
(1 results)
Research Products
(4 results)
-
-
[Journal Article] 感染症発見/監視システムBioCasterにおける専門用語アノテーションスキーマの構築2006
Author(s)
Kawazoe, A., Jin, L., Shigematsu, M., Barrero, R., Taniguchi, K., Collier, N
-
Journal Title
NAID
Related Report
-
[Journal Article] The development of a schema for the annotation of terms in the BioCaster disease detection/tracking system2006
Author(s)
Kawazoe, A., Jin, L., Shigematsu, M., Barrero, R., Taniguchi, K., Collier, N.
-
Journal Title
Proc. KR-MED
Pages: 77-85
Related Report
-