2020 Fiscal Year Research-status Report
機械学習による水中病原体と指標微生物の濃度相関解析法の精緻化
Project/Area Number |
19K04661
|
Research Institution | Gunma University |
Principal Investigator |
加藤 毅 群馬大学, 大学院理工学府, 准教授 (40401236)
|
Co-Investigator(Kenkyū-buntansha) |
佐野 大輔 東北大学, 環境科学研究科, 准教授 (80550368)
|
Project Period (FY) |
2019-04-01 – 2023-03-31
|
Keywords | 相関解析 / 水中病原体 / 指標微生物 / 打ち切りデータ |
Outline of Annual Research Achievements |
水利用における微生物学的安全性を担保するための水質衛生基準値の設定には,指標微生物濃度と病原微生物濃度との関係を適切に定量化することが重要である.2変量の関係性を表現する統計量はいくつか考えられ,それぞれ一長一短があるため,本研究では考えうる統計量に関して多角的に検討してきた.2種類の微生物の濃度が同時にある閾値以上になる割合は統計学に精通していない水質管理実践者にも直感的に理解でき,水中微生物濃度の確率分布に対する仮定をおかないため効果的な表現方法である.水質データにおいて特徴的な点は比較的観測しやすい補助データが利用可能な点である.例えば,水素イオン濃度,水温,生物化学的酸素要求量,化学的酸索要求量,浮遊物質量,溶存酸素量,大腸菌群数,総窒素,総リンは容易に利用可能であり,打ち切りデータでもない.これに対し,水中微生物濃度のデータはしばしば欠損値を含む.このため,2変量間の関係性を表す統計量の推定は単純な計算ではすまなくなる.もし観測データのみから統計量を計算してしまうと,統計的バイアスを含んだ推定となってしまうため,水質管理への応用に際しては行政判断を誤らせる危険をともなう.令和2年度は,水中微生物濃度がある閾値以上か否かを求めることができるアルゴリズムを開発した.それは,汎化誤差バウンドを有する統計的な裏付けのある機械学習の方法論になっている.機械学習のアルゴリズムにおいて,未知のデータに対して以下に正しく予測するかが重要な視点となる.開発したアルゴリズムは,未知のデータの予測率は,経験リスクを使った上限の一様収束が保証されている.かつ,緻密な最適化理論に基づく最適化アルゴリズムも整備したため,情報科学に馴染みのない水質管理実践者でもボタン一つで安定して動作させることができる.この成果をまとめた論文は国際会議ICPR2020にも採択され,高い評価を得た.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
水中微生物濃度を表す2変量の関係を表現する統計量を算出するための有用なアルゴリズムを開発できたので.
|
Strategy for Future Research Activity |
本研究プロジェクトは4年間の研究計画で実施されてきた.令和3年度で3年目に突入し,残り2年間で目標を完遂すべく,順調に研究を進めている.2種類の水中微生物濃度との関係を適切に定量化するためには,2変量の関係性を表現する統計量をなるだけ正確に算出する必要がある.水質データのうち,水素イオン濃度,水温,生物化学的酸素要求量,化学的酸索要求量,浮遊物質量,溶存酸素量,大腸菌群数,総窒素,総リンのような物理化学的データは容易に利用することができる.これに対し,水中微生物濃度のデータはしばしば欠損値を含むため,2変量の関係性を表す統計量の算出は単純ではない.令和元年度において,水中微生物濃度の確率分布を求めるための最尤推定アルゴリズムを開発した.そのアルゴリズムは,ドメイン知識を表す符号制約の下で確率分布のモデルパラメータを決定することができるものであった.パラメータ値決定に伴う最適化問題を解くために,正則化経験リスク最小化問題に等価変換することで双対問題を介した最小化アルゴリズムを開発した.令和2年度は,このアルゴリズムに含まれる技術を利用した正則化経験リスク最小化問題を解くために,閾値以上濃度の同時生起確率を算出することができる算法を開発した.本研究プロジェクトは残る2年間を使って,2種類の水中微生物濃度が両方とも打ち切られていてもピアソン相関係数を算出することができるアルゴリズムを開発する.また,実際の水質データを使って推定性能を検証する計算機実験を実施する.
|
Causes of Carryover |
研究を進めていくうえで必要に応じて研究費を執行したため,当初の見込み額と執行額は異なったが,研究計画に変更はなく,前年度の研究費も含め,当初予定 通りの計画を進めていく.
|
Research Products
(2 results)