研究課題/領域番号 |
25460801
|
研究種目 |
基盤研究(C)
|
研究機関 | 鳥取大学 |
研究代表者 |
井上 仁 鳥取大学, 総合メディア基盤センター, 准教授 (00176439)
|
研究期間 (年度) |
2013-04-01 – 2016-03-31
|
キーワード | 感染症 / 流行予測 / Webマイニング / インターネット |
研究概要 |
本研究の目的は、(1)時系列解析を用いた流行予測モデルの作成とその評価、(2)Webマイニング技術を活用した流行予測モデルの精度向上アルゴリズムの開発、および(3)インターネットを利用した感染症危機管理支援システムの構築である。 平成25年度は、時系列分析を目的として感染症発生動向調査データの収集と整理を行った。過去10年間の感染症発生動向調査データを収集し、都道府県別感染症別に分類してデータベースに蓄積した。その件数は約30万件である。蓄積したデータをインターネットを利用して可視化・還元できる仕組みを構築した。ホームページ上で任意の時期と場所を指定すれば、該当する情報がグラフや地図上にマッピングして表示されたり、あるいは流行状況の時間的・空間的推移を同時に可視化したアニメーションとして表示できる仕組みを構築した。 時系列分析による流行予測モデルについての検討を行った。過去10年間の感染症発生動向調査データにARIMAモデル、最近隣法、指数平滑化法等の流行予測モデルを当てはめて、予測結果と実データとを比較することで予測精度を評価した。その結果、都道府県ごとに最適なモデルに違いが見られたものの、最近隣法が全般的に比較的良い結果をもたらすことが認められた。また、最近隣法に基づいた予測プログラムをインターネット上のサーバに実装して、流行予測を提供できる仕掛けを構築した。 平成25年度は、26年度に予定しているWeb上のデータを流行予測に活用するための予備段階として、Twitterの書き込みと47都道府県のローカル新聞のホームページ記事から「インフルエンザ」を含む情報の収集についても行っている。Twitterについては、該当する書き込み約100万件を収集した。また、ローカル新聞についても同様に該当する記事の週ごとの情報収集を続けている。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
平成25年度の目標は感染症発生動向調査データを資料とした時系列分析により流行予測モデルを作成することであった。この目標に対して、1)過去10年間の発生動向調査データを収集・整理してデータベースを構築し、2)上記データを資料とした時系列分析により、最近隣法がARIMAモデル、指数平滑化法より的精度よく流行予測が行えることを明らかにした。また3)最近隣法に基づいた予測プログラムをインターネット上のサーバに実装して、流行予測を提供できる仕掛けを構築した。さらに、4)26年に予定しているWebマイニングの活用についても、データ収集の準備を行っている。このような進行状況から、おおむね順調に進展していると評価している。
|
今後の研究の推進方策 |
平成26年度以降は、感染症発生動向調査データの収集・整理を引き続き行い、時系列分析による流行予測モデルの評価を行う。加えて、平成26年度はWebマイニングを活用して流行予測精度を向上させる方策について検討を開始する。具体的には、Twitterのデータから、感染症に関連する書き込みを抽出し、週ごとの頻度分布を求めて、実際の流行状況との関連を調べ、流行予測に有効なパラメータとなりうるかを検討する。Twitterの書き込み情報の中には場所が特定できるものも含まれていることから、地域別の流行予測への活用についても検討を行いたい。47都道府県のローカル新聞のホームページは、リアルタイムで地域の情報を発信している。そこで、これらのホームページからも同様なデータの抽出を行い、地域別の流行予測精度向上への活用手法についても検討を行いたい。
|
次年度の研究費の使用計画 |
Twitterのデータ1年分の購入費が約40万円と予想よりも高く、本年度に予定していたサーバ購入ができなかった。本年度は別サーバを流用して研究を行ったが、残金は次年度でのサーバ購入経費の足しにしたい。 次年度はサーバを新調し、情報発信システムの本格的構築を図る。
|