研究課題/領域番号 |
20K11710
|
研究機関 | 岡山大学 |
研究代表者 |
栗原 考次 岡山大学, 環境生命科学学域, 教授 (20170087)
|
研究期間 (年度) |
2020-04-01 – 2023-03-31
|
キーワード | エシェロン解析 / 時空間情報 / 可視化 / 位相的データ解析 |
研究実績の概要 |
令和3年度は、1.空間疫学における地域に関する空間リスク指標の計算と可視化、2.時空間データにおける真のクラスター(ホットスポット)に近いクラスターの検出法、3.時空間データにおける現在進行中(前向き)のクラスター検出法、4.研究成果を反映したテキストの出版、に関する研究を集中的に行った。 1.では、空間疫学で用いられる疾病の罹患や死亡の危険度を表すリスクの指標を計算するとともに、それらの結果を対話型で操作しながら地図上に可視化できるソフトウェアをRのshinyパッケージを用いて開発・公開した。これらの研究結果は、日本計算機統計学会の和文誌「計算機統計学」の第33巻第2号において公表した。 2.では、時空間データにおいて、より真のクラスター(ホットスポット)に近いクラスターの検出を可能にする新たな手法を提案した。すなわち、検出されるクラスターの持つ形状の制限を排除しリスクの低い領域を含まない手法として、データの持つ位相的な空間的階層構造に基づき上位階層の領域から構成されるクラスターを求めた。研究成果は日本計算機統計学会の和文誌「計算機統計学」の第34巻第1号において公表した。 3.では、感染症などのサーベイランス問題において応用されている常に最新日が含まれる prospective (前向き)ホットスポットの検出をデータの持つ位相的な空間的階層構造に基づく方法について提案した。研究成果は2021年度日本分類学会シンポジウムにおいて公表した。 4.では、共立出版から統計学One Pointシリーズ第19巻「エシェロン解析」を発刊した。テキストでは、エシェロン解析の基礎となる考え方やアルゴリズム,さらに,エシェロンの構造を利用した応用例として,圏による地域の分類,リモートセンシングデータの分析,ホットスポットの検出,そして,エシェロン解析のためのソフトウェアを取り上げている。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究では、時空間データに対して同位相分類に基づくエシェロン階層的構造を利用し、(1)種々の形状のホットスポットを検出可能なエシェロンスキャン法、(2)ホットスポットの中にリスクの低い領域を含まないエシェロンスキャン法、(3)ホットスポットの中に最新日が含まれるようにスキャンするエシェロンスキャン法、(4)大規模データのホットスポットを検出するためのエシェロンスキャン法、などに関してエシェロン解析の理論と応用の研究を進めてきた。提案手法の適用例としては、日本国内での都道府県別COVID-19の感染率データに対して、ホットスポットを検出などに関する分析をしている。また、提案手法のアルゴリズムを公開するとともにソフトウェアをリリースしている。 位相的データ解析については、これまでに薬物間の関係を体系的に視覚化するために、位相的データ解析(Topological Data Analysis :TDA)のMapper技法を使用した研究を行ってきた。具体的には、医薬品情報がテキストデータとして記述されているWikipedia及び医薬品情報が化学記述子データの化合物情報として格納されているDrugBankの2種類のデータを定量化し、TDA Mapperを適用する方法を提案した。すなわち、テキストデータ及び化合物情報の化学的な構造情報に基づき、医薬品間の位相的な構造を求める方法を提案している。提案方法により、適応疾患に関連する連続的な形状として捉えることができ、分類結果から様々な解釈及びその分類結果に基づくドラッグリポジショニングが可能となる。 また、時空間データの可視化と位相的データ解析の利用を促進するため、これまでの研究成果に関する手法のRのshinyパッケージの公開を行った。さらに、空間データの位相的階層構造を求めるためのエシェロン解析の理論と応用に関するテキストの出版を行った。
|
今後の研究の推進方策 |
今後もこれまで研究を行ってきた時空間データのエシェロン解析による同位相分類と構造解析に基づく技法を基に位相的データ解析に関する研究を進める。今まで空間データの同位相分類を行うために進めてきた研究で用いられる技法は2つのステージから成り、第1ステージでピークを求め、第2ステージでファウンデーションを求める方法であった。今後の研究で行う技法は、2次元格子に対して、同位相を持つような順番に1次元格子に並び変え、1次元の場合と視覚的に同じイメージで位相的データ解析を行うものである。例えば、5×5の2次元格子データに対して、同じ位相を持つ分類に基づき25個の1次元格子に並び替えることにより、視覚的に1次元格子データと同じイメージで取り扱うことを利用する。簡単のために、タイ(同じ値)はないものとする。アルゴリズムは最大値を持つ格子を始点として、隣接する格子で異なる位相を持つ格子が出現するまで同位相となるデータを追加し、次に隣接する格子で異なる位相に隣接する格子の最大値を次の始点として同様な手順を繰り返す方法である。このような手順により、2次元の格子は1次元の格子として並び替えられ、1次元格子と同様な可視化を行うことができる。さらに、新たな接近法としてTDAの一つ技法であるパーシステントホモロジーのようにデータの各点を中心とした円を考え、半径を増加させた図形の形に着目したTDA解析についての研究も行う。また、研究成果によるアルゴリズムやソフトウェアの構築を行う予定である。
|
次年度使用額が生じた理由 |
当初、参加を予定していた国際学会、国内学会が中止、延期、またはオンラインで開催されたため、旅費として計上していた予算はかなり使用できなかった。学会については、2022年度は延期になった国際学会も含めハイブリッド開催予定であり、旅費などのために次年度使用額として計上している。
|