2022 Fiscal Year Research-status Report
LHC・ATLAS実験データ解析における深層学習の発展
Project/Area Number |
21K13936
|
Research Institution | The University of Tokyo |
Principal Investigator |
齊藤 真彦 東京大学, 素粒子物理国際研究センター, 助教 (70865162)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Keywords | 素粒子物理学 / ATLAS実験 / 機械学習 / 深層学習 |
Outline of Annual Research Achievements |
本研究の目的は高エネルギー実験における実験データ解析に深層学習、特に実験データの構造を踏まえた深層学習モデルを適用することで、解析性能の向上、および説明可能性の向上を目指すことである。本年度は、昨年度に引き続きヒッグス粒子が2つのタウ粒子に崩壊する過程に着目し、複数の検出器信号からタウ粒子を同定する深層学習モデル、およびタウ粒子を含む複数の粒子群からヒッグス粒子を同定する深層学習モデルの2つの目的の異なる深層学習モデルを構築し、それらを直列につなげて全体を最適化させる研究を進めた。2つの深層学習モデルを接続する際、一方のモデルの出力がもう一方のモデルの入力となるように直接接続すると、後段モデルの性能が劣化する。深層学習モデルをマルチタスク学習のような形式で接続し学習させることで、多段の教師データが与えられているこの問題特有の構造を生かし、かつ後段モデルの予測性能劣化を緩和できることを実験的に示した。またマルチタスク学習の形式を用いることで、モデルの学習手法としてマルチタスク学習の手法を応用することが可能となり、複数モデルの効率的な学習が可能となることも実験的に示した。 深層学習を用いた異常検知の手法を素粒子物理実験の問題に適用する研究も推進した。特に、正規化流を用いた異常検知手法を題材に、用いる正規化流モデルの種類(Masked Autoregressive Flow、Spline Flow等)やモデルのハイパーパラメータ(ブロック数や内部パラメータの数)の最適化が異常検知の性能にどのような影響を与えるのかを調査した。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
複数の教師あり学習タスクの組み合わせで大きな問題を処理するという素粒子物理実験データ解析に特徴的な問題構造を、深層学習モデルの構造に組み込み、予測性能改善を実現することができた。また、大きな問題を複数のタスクに分割させることでモデル出力の中間状態に解釈可能な形でアクセスすることが可能になるため、深層学習における予測過程の解釈可能性にも一定の可能性を与えることができた。一方で、当初想定していた対称性や不定性を深層学習モデルに組み込む研究の達成には至らなかった。
|
Strategy for Future Research Activity |
今後は、識別モデルおよび異常検知の手法に関して、素粒子の対称性や実験の不定性を組み込む研究を推進する。特に異常検知は、識別モデル以上にデータの正確なモデリングが重要であり、対称性や不定性を組み込むことができれば大きな性能向上が見込まれる。実データ(評価データ)とMCサンプル(学習データ)の差を考慮した学習にも取り組み、実データへの適用時にも性能劣化が小さいモデルの構築を目指す。
|
Causes of Carryover |
研究の進捗状況、及び使用した深層学習モデルの性質により、大規模な深層学習モデルのトレーニングを必要とする機会がなく、当初予定していたクラウド資源を用いた大規模学習の実施を見送った。次年度の経費として、これまでの成果の発表および研究に関連する研究者との意見交換のための国内・国際会議出席としての旅費、および大規模深層学習モデルのトレーニングのためのクラウド資源としての物品費を計画している。
|
Research Products
(2 results)