研究課題/領域番号 |
15K00591
|
研究機関 | 群馬大学 |
研究代表者 |
加藤 毅 群馬大学, 大学院理工学府, 准教授 (40401236)
|
研究分担者 |
佐野 大輔 北海道大学, 工学(系)研究科(研究院), 准教授 (80550368)
小林 彩乃 和歌山工業高等専門学校, その他部局等, 助教 (30736153) [辞退]
|
研究期間 (年度) |
2015-04-01 – 2018-03-31
|
キーワード | 汚染調査と評価 / 機械学習 |
研究実績の概要 |
水質モニタリングデータから病原体濃度の高低を予測するためには,その判別ルールを獲得するための水中病原体濃度データの蓄積が必須である.本研究グループにおいて,札幌市内の河川に6か所のサンプリング地点において得られた大腸菌濃度データを整理し,および国土交通省を通じて各サンプリングの時点における水質水文データを収集した.国土交通省の定める基準のひとつ,500MPN/100ml以上を陽性,未満を陰性としたバイナリ識別タスクを形成した.このようにして得られた説明変量を基にして,平滑化ヒンジサロゲート損失およびL2正則化関数を用いて得られる正則化経験リスクの上限を最小化するアルゴリズムを実装した.ここで得られる最適化問題に対して双対問題を考える.N個の訓練用標本に対して,双対目的関数は,サロゲート損失の凸共役からなるN個の項と正則化関数から導かれる項の和になるが,各双対変数は,その前者のうちの一つの項と正則化関数から導かれる項のみに依存するため,最大化が容易となる.この性質を利用して,双対座標上昇法を計算機上に実装し,最適性の保証がある最適化を実現した.説明変量には変量間のスケールの違いによる学習の弊害を緩和させる線形変換を行い,カテゴリ変量にはダミー変数変換を施した.このようにして得られたモデルパラメータおよびデータ記述子を評価用データに適用したところ,良好なPRBEP (Precision-Recall Break Even Point)を獲得し,高い汎化性能が得られることを確認した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
当初の計画通り,説明変量および目的変量のデータの収集と整理を達成し,また,判別ルールを自動獲得するための機械学習法の選択,および最適化アルゴリズムの実装を成し遂げた.これを使った実データでの評価実験も行い,良好な汎化性能が得られることを確認できた.
|
今後の研究の推進方策 |
今後は,サンプリング点の違いおよび天候データを学習および予測にどのように反映させるか試行錯誤的に検討し,また判別に有用な特徴変換法を考案したり,このタスクに機械学習理論を特化させたり,して更なる性能の向上を図る.また,完成したアルゴリズムのオンラインソフトウェアを構築するために,C言語などへの移植を行う.またインターフェースを構築するために,Apacheによるウェブサーバの構築を行い,CGIプログラムの開発を行っていく.
|
次年度使用額が生じた理由 |
次年度使用額が生じた理由は,研究発表の場所が近くになり,予定より交通費が発生しなかったことが一つである.平成27年度は,どちらかというと情報科学的に大きな貢献をできる発見を得るに至り,その発見を発表するにふさわしい場所が本務地からさほど離れていなかったので,次年度使用額が生じた.
|
次年度使用額の使用計画 |
病原性微生物濃度の予測精度を向上させるため,気象データの整理および学習アルゴリズムへの導入を進める.データ整理に伴う人件費,および計算実験装置の取得費に用いる.
|