研究課題/領域番号 |
19K04661
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分22060:土木環境システム関連
|
研究機関 | 群馬大学 |
研究代表者 |
加藤 毅 群馬大学, 情報学部, 教授 (40401236)
|
研究分担者 |
佐野 大輔 東北大学, 環境科学研究科, 准教授 (80550368)
|
研究期間 (年度) |
2019-04-01 – 2023-03-31
|
研究課題ステータス |
中途終了 (2021年度)
|
配分額 *注記 |
4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2022年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2021年度: 520千円 (直接経費: 400千円、間接経費: 120千円)
2020年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
2019年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
|
キーワード | 環境水質工学 / 機械学習 / 相関解析 / 水中病原体 / 指標微生物 / 打ち切りデータ / 相関係数 / ドメイン |
研究開始時の研究の概要 |
水利用における微生物学的安全性を担保するための水質衛生基準値の設定には,指標微生物濃度と病原体濃度との相関関係を適切に定量化することが重要である.しかし,病原体濃度の低い陽性率が相関解析の精度を悪化させ,相矛盾する結論を主張する研究が散見される状況にある.本研究は,機械学習的なアプローチによって濃度相関解析法の抜本的な再構築を試みるものである.従来は、濃度の相関の算出のために対象となるデータのみが用いられてきた.本研究では,水質データや水質工学で培われてきた知見を利活用することで,相関解析アルゴリズムの革新的な精度向上を実現する.
|
研究実績の概要 |
環境水や飲用水には感染症を引き起こす病原体が含まれることがある.病原体とは病原細菌,病原ウイルス,および原虫を含む.モニタリングされる指標微生物の水質衛生基準値を設定する際には,指標微生物濃度と病原体濃度との相関関係を適切に定量化することが求められる.しかし,病原体の陽性率の低さが相関計算の障害となっている.本研究では,近年著しい発展を遂げる機械学習を使うことで,指標微生物と病原体の濃度相関解析を改善することを目指した.従来は指標微生物や病原体の濃度を使って相関を計算してきた.これに対し,本研究は,指標微生物や病原体の濃度と同時に取得できる水質データやドメイン知識を利活用することで,相関解析法の高精度化を狙った. 統計学において,トビット法という,非定量値と回帰直線を同時に推定する方法がある.トビット法では,観測された病原体濃度の確率密度関数,および検出限界を下回った濃度がその確率モデルにおいて非観測となる確率質量関数を得ることが出来,それらを組み合わせることで回帰係数の尤度関数を構成する.このアプローチをそのまま使ってしまう場合,予測に用いる情報が不十分になるため,非検出値の予測分布は大雑把なものにしかならず,そこから得られる相関解析は十分な精度で得られない.本研究では,水質データの援用によって,非検出値の予測分布を精密にすることで,相関係数の精度を向上させた.個別の説明変数の予測能力はさほど強くないため,標本が小さいとき符号が逆転した標本相関が発生する.本研究では,ドメイン知識を符号制約で表すことで,標本が小さくても,回帰分析の精度を大きく改善させ,これを相関解析のワークフローに取り込むことで,相関解析の精度を向上させることに成功した.
|