LHC・ATLAS実験データ解析における深層学習の発展
Project/Area Number |
21K13936
|
Research Category |
Grant-in-Aid for Early-Career Scientists
|
Allocation Type | Multi-year Fund |
Review Section |
Basic Section 15020:Experimental studies related to particle-, nuclear-, cosmic ray and astro-physics
|
Research Institution | The University of Tokyo |
Principal Investigator |
齊藤 真彦 東京大学, 素粒子物理国際研究センター, 助教 (70865162)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Project Status |
Granted (Fiscal Year 2022)
|
Budget Amount *help |
¥2,990,000 (Direct Cost: ¥2,300,000、Indirect Cost: ¥690,000)
Fiscal Year 2022: ¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000)
Fiscal Year 2021: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
|
Keywords | 素粒子物理学 / ATLAS実験 / 機械学習 / 深層学習 |
Outline of Research at the Start |
大規模で複雑なデータを効率よく解析する手法の一つに深層学習がある。深層学習が高エネルギー実験データ解析で広く使われるためには、実験データに頻出する非定型データ構造を扱い、不定性の評価・予測結果の解釈が可能な深層学習モデルの実現が求められる。本研究では、LHC・ATLAS実験における物理解析データを用いて、(1) グラフ深層学習をベースにした、入力データの構造・対称性を考慮した深層学習モデルの開発、(2) 深層アンサンブル学習を始めとする不定性を扱える深層学習手法の活用とその評価、により上記の問題の解決を目指す。
|
Outline of Annual Research Achievements |
本研究の目的は高エネルギー実験における実験データ解析に深層学習、特に実験データの構造を踏まえた深層学習モデルを適用することで、解析性能の向上、および説明可能性の向上を目指すことである。本年度は、昨年度に引き続きヒッグス粒子が2つのタウ粒子に崩壊する過程に着目し、複数の検出器信号からタウ粒子を同定する深層学習モデル、およびタウ粒子を含む複数の粒子群からヒッグス粒子を同定する深層学習モデルの2つの目的の異なる深層学習モデルを構築し、それらを直列につなげて全体を最適化させる研究を進めた。2つの深層学習モデルを接続する際、一方のモデルの出力がもう一方のモデルの入力となるように直接接続すると、後段モデルの性能が劣化する。深層学習モデルをマルチタスク学習のような形式で接続し学習させることで、多段の教師データが与えられているこの問題特有の構造を生かし、かつ後段モデルの予測性能劣化を緩和できることを実験的に示した。またマルチタスク学習の形式を用いることで、モデルの学習手法としてマルチタスク学習の手法を応用することが可能となり、複数モデルの効率的な学習が可能となることも実験的に示した。 深層学習を用いた異常検知の手法を素粒子物理実験の問題に適用する研究も推進した。特に、正規化流を用いた異常検知手法を題材に、用いる正規化流モデルの種類(Masked Autoregressive Flow、Spline Flow等)やモデルのハイパーパラメータ(ブロック数や内部パラメータの数)の最適化が異常検知の性能にどのような影響を与えるのかを調査した。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
複数の教師あり学習タスクの組み合わせで大きな問題を処理するという素粒子物理実験データ解析に特徴的な問題構造を、深層学習モデルの構造に組み込み、予測性能改善を実現することができた。また、大きな問題を複数のタスクに分割させることでモデル出力の中間状態に解釈可能な形でアクセスすることが可能になるため、深層学習における予測過程の解釈可能性にも一定の可能性を与えることができた。一方で、当初想定していた対称性や不定性を深層学習モデルに組み込む研究の達成には至らなかった。
|
Strategy for Future Research Activity |
今後は、識別モデルおよび異常検知の手法に関して、素粒子の対称性や実験の不定性を組み込む研究を推進する。特に異常検知は、識別モデル以上にデータの正確なモデリングが重要であり、対称性や不定性を組み込むことができれば大きな性能向上が見込まれる。実データ(評価データ)とMCサンプル(学習データ)の差を考慮した学習にも取り組み、実データへの適用時にも性能劣化が小さいモデルの構築を目指す。
|
Report
(2 results)
Research Products
(5 results)