研究課題/領域番号 |
22K04372
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分22060:土木環境システム関連
|
研究機関 | 群馬大学 |
研究代表者 |
加藤 毅 群馬大学, 情報学部, 教授 (40401236)
|
研究分担者 |
佐野 大輔 東北大学, 工学研究科, 教授 (80550368)
|
研究期間 (年度) |
2022-04-01 – 2026-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2025年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2024年度: 520千円 (直接経費: 400千円、間接経費: 120千円)
2023年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
2022年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
|
キーワード | 水質データ / 統計解析 / 最適化アルゴリズム / 微生物学的感染リスク / 水中病原体 / 指標微生物 / 相関解析 / アルゴリズム / 機械学習 |
研究開始時の研究の概要 |
水中病原体濃度と指標濃度の相関関係を適切に定量化することは,微生物学的感染リスクを管理し公衆衛生を保全するための環境政策や規制の設計において重要である.しかし,病原体濃度の陰性率が高いと,相関解析の推定結果と真の統計値との誤差が大きくなり,誤った結論が導かれてしまう.本研究は,機械学習的なアプローチによって濃度相関解析法の再構築を試みるものである.従来は,病原体と指標のペアごとに個別に濃度の相関を算出していた.本研究で創出する新しいパラダイムは,水質データや水質工学分野の知見を利用し,かつ,測定した病原体群と指標群の濃度を相互利用して,同時に相関解析を行うものである.
|
研究実績の概要 |
環境保護政策の策定において,水中の病原体と指標濃度の関係を数値化することは,感染症のリスクを抑制し,公衆の健康を守る上で不可欠である.病原体の濃度が低い場合,統計的な相関分析は不正確な結果を生む恐れがあります.不正確な結論を導いてしまう理由は,病原体濃度の陰性率が高くなってしまうからである.病原体濃度の陰性率が高いと,従来の相関係数の定義式に代入するだけでは真の相関係数との間に無視できないずれが生じてしまう.この問題に対処するため,本研究では機械学習を駆使して,新たな相関分析手法を開発している.これまでの手法では,病原体と指標の関係を一対一で分析していたが,新しいアプローチでは,水質データと水質工学の専門知識を組み合わせ,複数の病原体と指標を同時に分析するものとなっている.
本研究では,トビット解析という手法を応用し,検出限界以下のデータを含む回帰分析を行うことで,従来のモデルの限界を克服した.新しいアルゴリズムでは,ターゲット変数を複数設定し,データセット全体の同時推定を実現する.統計学分野では,もともとトビット解析と呼ばれる非検出値を含むデータから回帰分析を行う解析法が存在していた.しかし,従来のトビットモデルは2変数間を個別に求める方法であり,データ行列全体を同時推定できる枠組みではなかった. 本研究では,同時推定のモデルの回帰係数の最適化のために座標上昇法を適用した.この方法により,各ステップを明確に定義で,ユーザーが調整することなく,安定した推定値を獲得することが可能になった.さらに,水質データや水質工学分野の知見を活用し、測定した病原体群と指標群の濃度を相互利用して同時に相関解析を行うことができるようになっている.本年度は,人工データを使った計算機実験を行い,開発したアルゴリズムの推定精度を検証した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
当初の計画は,個別相関分析の方法論を数理的に整理して,同時相関分析に拡張できるように再定式化を行うことになっていた.実際に個別相関分析の方法論を数理的に整理し同時相関分析ができるようアルゴリズムを一般化した.また,人工データを使ったた計算機実験を行い,開発したアルゴリズムの数値的安定性,および推定精度の向上を確認した.よって,おおむね順調に進展していると判断した.
|
今後の研究の推進方策 |
今後は,実際の水質データを使った計算機実験を行い,開発したアルゴリズムの推定精度を検証する予定である.
|