2020 Fiscal Year Research-status Report
小データな多ドメイン間での知識共有のための機械学習手法の開発とその応用
Project/Area Number |
20K19871
|
Research Institution | Nagoya University |
Principal Investigator |
松井 孝太 名古屋大学, 医学系研究科, 講師 (50737111)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Keywords | 機械学習 / 転移学習 / 能動学習 / スモールデータ |
Outline of Annual Research Achievements |
本研究の初年度では,まず単一ドメインにおける能動学習アルゴリズムの深化とその応用に注力しました.
スモールデータなドメインの典型的な例である医学や材料科学の問題では,現象に対して確率モデルを仮定し,不確実性の下でデータ取得と意思決定を行いますが,本研究では現象のモデルとしてガウス過程を用いるベイズ最適化に注目し,所望の構造出力(ここでは各要素が相関を持つ多次元ベクトルを指す)を達成する入力パラメータを見つける逆問題のための能動学習法を考察しました.理論的な貢献としてブラックボックスなベクトル値の目的関数に対して出力の要素間の相関を明示的にガウス過程モデルに取り込むことにより,少ない観測点数で所望の構造出力とモデルによる予測との間の誤差を最小化するための新たな獲得関数を導出し,材料科学分野における炭化ケイ素 (SiC) 結晶成長モデリングのデータを用いた有効性の検証によって,相関を考慮しないモデル化に比べて高速に所望の出力を発見できることを確認しました.
さらに,ベイズ最適化のより具体的な材料科学分野への応用として,シリコン (Si) エピタキシャル成長プロセスへの応用を試みました.この問題では,基幹半導体材料であるSiウェーハの生成過程の一部であるSiエピタキシャル膜を成長させるプロセスにおいて,多数の品質パラメータと実験条件パラメータの同時最適化をできるだけ少ない実験回数で行うものです.全パラメータを用いた評価コストの高いブラックボックス関数のモデルと一部のパラメータのみを用いた評価コストの低いブラックボックス関数のモデルを適宜切り替えながらベイズ最適化を実行した上で,絞り込まれた条件に対してプロセスエンジニアによる最適化も併せて行うことで,Siエピタキシャル膜の成長効率を2倍とする条件を発見することができました.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究は能動学習と転移学習を組み合わせたスモールデータなドメインに対する新たなデータ解析のフレームワークの開発を目指すものです.能動学習に関しては,現在までに構造出力を持った材料生成プロセスにおける理想的なパラメータ探索という実際の材料科学の問題を取り扱うための新たなベイズ最適化法の開発や,現実のSiエピタキシャル膜生成プロセスの最適化問題へのベイズ最適化法の適用を行うことができました.一方,転移学習に関しては大規模なサーベイを行いました.転移学習は,機械学習のあらゆる方法論をより一般的な状況へ拡張するための枠組みであり,その全体像を把握することは容易ではありません.今回行ったサーベイに基づいて転移学習を体系化することを試みており,これは今後能動学習と組み合わせた新たな方法論を構築する際に重要であると考えます.
|
Strategy for Future Research Activity |
今年度得られた知見をもとに,複数の小データなドメイン間での効率的な転移学習を実現するための能動学習アルゴリズム開発を行います.転移学習の性能は目標ドメインにおける期待リスクによって評価されるため,能動学習におけるデータ選択基準として「期待リスクをより小さくするものを選ぶ」ことを考えるのは自然と言えます.したがって,目標ドメインにおける期待リスクの評価機構を取り入れた能動学習アルゴリズムの開発が,本研究の目的に対して重要な意味を持つと考えています.また,転移学習の体系化は引き続き行い,書籍の形で出版することを計画しています.さらに,材料科学分野における現実の問題への応用を考えるため,大型放射光施設であるSPring-8での測定実験への参加を計画しています.
|
Causes of Carryover |
今年度は新型コロナウイルスの感染拡大に伴い,参加予定であった学会・研究集会のほとんどがオンライン開催ないし中止となりました.その影響で,特に予算として計上していた旅費及び学会への参加費が使用されないという状況となったため,次年度使用額が生じました.次年度も今年度と同様の状況がしばらくは予想されるため,本研究のための計算環境の充実を図り,新たな計算機の購入を計画しています.
|