2020 Fiscal Year Research-status Report
Building a Program for Chemical Risk Assessment using Machine Learning
Project/Area Number |
20K22185
|
Research Institution | Nagoya University |
Principal Investigator |
原田 敬章 名古屋大学, 環境安全衛生推進本部, 准教授 (80888925)
|
Project Period (FY) |
2020-09-11 – 2022-03-31
|
Keywords | 安全教育 / リスクアセスメント / 化学物質管理 / 機械学習 |
Outline of Annual Research Achievements |
本研究の目的は、機械学習を用いて実験計画を解析することで、取り扱うすべての化学物質の危険有害性の特定と実験に潜むリスクの見積りを自動で行い、総合的なリスクを出力する化学物質リスクアセスメントのプログラムの構築である。2020年度の主な実績は、機械学習で用いる機器の購入と分析するデータの収集である。 機械学習やその一種である深層学習では大量のデータを解析するため、一般的なコンピューターでは研究の進捗を妨げるほど多くの日数がかかってしまう。本学のスーパーコンピューターで解析することもできるが、研究の初期段階では試行錯誤を繰り返すため、多額の費用がかかることが予測されるだけでなく、スーパーコンピューターを利用できる環境は限られており、一般的な研究室等が利用することは難しい。よって、本研究の波及効果を考え、より安価に機械学習のデータ解析を高速で行うことにも用いられているGPU(グラフィックス プロセッシング ユニット)を搭載した深層学習向けの市販コンピューター一式を購入した。また、プログラムの構築で用いるMATLABは、購入した最新のGPUのアーキテクチャに適応したR2021aのプレリリース版をインストールした。 化学物質の危険有害性を示すGHS区分と引火点等の性質の既知情報を機械学習で解析するため、そのデータを収集した。独立行政法人製品評価技術基盤機構が提供する「政府によるGHS分類結果」を利用し、化学物質の危険有害性を示すGHS区分の情報を得た。また追加して、アメリカ国立衛生研究所(NIH)の下の国立生物工学情報センター(NCBI)によって維持管理されている化学分子データベース「PubChem」から、引火点等の物理的及び化学的性質等の情報を得た。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
購入した深層学習向けコンピューターに搭載したGPUは、2020年度後期に発売されたGeForce RTX 3090である。本研究の申請時に想定していた同系統の従来品より2倍ほど性能が改善しており、機械学習の解析速度の向上が見込まれる。このGPUには新しいアーキテクチャ(Ampere)が採用されているため、プログラムの構築で用いる予定であった2020年度版のMATLABは完全には対応していなかった。そこで、この新しいアーキテクチャに対応しているプレリリース版のMATLAB R2021aを使用した。MATLABは、古すぎるGPUでなければ、通常、下方互換性があるため、今後のMATLABの版が変わっても問題なく使用することができる。 機械学習で解析する化学物質の既知情報を収集した。独立行政法人製品評価技術基盤機構が提供する「政府によるGHS分類結果」を利用し、約4000件の化学物質の危険有害性を示すGHS区分の情報を得た。この情報には、GHS分類しか掲載されていないため、化学物質の物理的及び化学的性質等の情報を収集する必要があった。アメリカ国立衛生研究所(NIH)の下の国立生物工学情報センター(NCBI)によって維持管理されている化学分子データベース「PubChem」には、GHS分類だけでなく、引火点等の物理的及び化学的性質等の情報も掲載されており、そのデータ約1万件を入手した。
|
Strategy for Future Research Activity |
2021年度は、本リリース版のMATLABを用いて機械学習のプログラム構築を開始する。2020年度に入手したデータを解析に適するようまとめ、機械学習によって解析し、化学物質の危険有害性が特定できるか試みる。 また本研究では、当初から計画していたリスクの見積りを行うプログラムを構築する。大学等で発生した化学物質による事故報告を機械学習で解析するため、国立大学の事故情報を利用する。現在、その事故情報の更新作業が行われており、まとまり次第解析できるようプログラムの構築を進める。プログラムの構築には、既存の自然言語処理のツールを用いるため、比較的容易に行える見込みである。よって、化学物質の危険有害性を特定するプログラムの構築が困難な場合は、事故情報を解析するプログラムの構築を優先することも検討する。
|
Causes of Carryover |
物品費は、2020年度予算内で購入できるよう、本研究で主に使用する機器の仕様を見直し、GPUの購入は1台としたため、若干の差額が生じた。2021年度に合算し、研究の進捗に応じて2台目のGPU等使用する機器に関する物品を購入する見込みである。旅費は計画当初より2021年度に使用予定であり、学会で本研究成果を発表する予定である。新型コロナウイルスの感染拡大防止措置等のため、プログラミングに関し専門家からアドバイスを受け、謝金を支払う機会がなかった。2021年度はビデオ会議等を用いてアドバイスを得た場合にその謝金を使用する。
|