研究課題/領域番号 |
19K06308
|
研究機関 | 国立研究開発法人農業・食品産業技術総合研究機構 |
研究代表者 |
源川 拓磨 国立研究開発法人農業・食品産業技術総合研究機構, 食品研究部門, 主任研究員 (10571698)
|
研究期間 (年度) |
2019-04-01 – 2022-03-31
|
キーワード | スペクトル解析 / 機械学習 / データクレンジング / AI |
研究実績の概要 |
本研究では,スペクトルデータ向けのデータクレンジング法を開発し,モデルデータおよび実サンプルデータでの機械学習に適用し,データクレンジングの適用の有無による解析結果の差異を明らかにする。2019年度の研究実績の概要は以下のとおりである。 データクレンジング法の開発:スペクトルデータ向けのデータクレンジング法を開発した。オリジナルデータ(原スペクトル)から解析波長域を選択するために,Moving-window PLS回帰法とSNV処理を組み合わせた解析アルゴリズム(Searching Region SNV)を採用し、さらに選択された波長域について、グリッドサーチ法により2次微分処理の計算パラメーターを最適化する手法を採用した。これらを組み合わせた手法を、オリジナルデータからベースライン変動とバンド重複の外乱因子を排除するデータクレンジング法とした。 モデルデータでの検証:開発したデータクレンジング法の有効性を明らかにするために,解析結果を検証可能なモデルサンプル(糖濃度を段階的に調整した水溶液)の近赤外スペクトルを用いて機械学習の1つである回帰分析を行った。データクレンジング法の適用により、溶媒である水由来のバンドに基づく間接的な回帰モデルではなく、基質である糖由来のバンドの強度変化を直接反映した回帰モデルを構築することが可能であった。その結果、回帰モデルの複雑さ(説明変数の数)は低減されており、機械学習によって構築された回帰モデルについて科学的な根拠を検討することが可能であった。回帰精度についても、データクレンジングを適用した方が良い結果を示したことから、開発したデータクレンジング法がスペクトルデータの機械学習に有効であることが確かめられた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
研究代表者の所属研究機関の変更があったが、データクレンジング法の開発とモデルサンプルの近赤外スペクトルを用いた解析による性能評価を達成しており、当初の計画通り順調に進展している。2020年度は、実サンプルでの性能評価のための農産物や食品素材の近赤外スペクトルを用いた解析を行い、研究目的の達成を目指す。
|
今後の研究の推進方策 |
今後は、実サンプルでの性能評価を行うために農産物や食品素材の近赤外スペクトルを用いた解析を行い、その結果をもとにデータクレンジング法の改良を行う。また、人為的に欠損値や異常値を与えたスペクトルデータを用いて、これらの検出能力を評価する。さらに、適用する範囲を分光イメージングのスペクトルデータに拡張し、データクレンジング法の汎用性を評価する。
|
次年度使用額が生じた理由 |
物品費の予算について、当初予定よりも割引された金額での購入が可能となり、結果として未使用額が生じた。未使用額は次年度の物品費として利用する。
|