研究課題/領域番号 |
21K11834
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分60050:ソフトウェア関連
|
研究機関 | 千葉工業大学 |
研究代表者 |
BRYZGALOV PETR 千葉工業大学, 人工知能・ソフトウェア技術研究センター, 主任研究員 (70709691)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2023年度: 520千円 (直接経費: 400千円、間接経費: 120千円)
2022年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2021年度: 2,730千円 (直接経費: 2,100千円、間接経費: 630千円)
|
キーワード | 畳み込みニューラルネットワーク / CNN / GPU性能 / 性能予測 / ミニバッチサイズ / PyTorch / ソフトウェア性能解析と予測 / 機械学習 / GPGPU |
研究開始時の研究の概要 |
畳み込みニューラルネットワーク(CNN) の学習は大量の計算が必要となるため、GPU を用いて高速化するのが常識となっている。ところが、学習に要する時間は GPU タイプや学習パラメータなどによって複雑に変化するため、場合によっては高価でピーク性能の高い GPU を使うよりも安価な GPU を使ったほうが高速に学習できる場合もある。このように、コスト・学習時間の観点から最適な学習環境を見つけることは困難であった。これに対し本研究では、様々な学習パラメータや GPU タイプにおいて CNN の学習時間を予測する仕組みを実現することを目指す。
|
研究実績の概要 |
1. CNN学習時間の予測に使う畳み込み層の時間を、より正確にベンチマークするため、畳み込み層の時間をベンチマークするプロクシアプリDNNMarkの修正・改良を行った。 2. 予測モデルの精度と汎用性を高めるため、なるべく多くのCNNを学習に使うことが必要なので、CNNは昨年度に使った14種類から25種類まで増やし、PyTorchで実装されたCNNの学習時間を記録し、改良したプロクシアプリを使って畳み込み層の時間をベンチマークした。その際、科研費で購入したマシンとクラウド計算機を使い、合わせて5台のマシンで5種類のGPUを使用した。 3. 一台のマシンにおいて未知のCNNの学習時間を予測するモデルを構築するためのアプローチを開発した。 このアプローチで作成した予測モデルの特徴は、CPUの性能がボトルネックとなる小さなミニバッチサイズや、GPUの性能に依存する大きなミニバッチサイズを含む、幅広いミニバッチサイズにおいてCNNの学習時間を予測できるということである。 4. 一部のマシンにおいて、CNNの学習時間を高精度で予測できるモデルを構築するための特徴量とハイパーパラメーターを見つけ、25種類のPyTorchで実装されたCNNを使って予測の評価を行った。十分な予測性能を得られたことが確認できた。 5. 予測モデルの種類を深層ニューラルネットワークから学習の速いXGBoostに変えたため、予測モデルの構築が速くなった。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
CNNの中にはdepthwise畳み込み層というものが含まれることがあるが、そのdepthwise層を考慮したアプローチの開発に時間がかかったため、進捗に遅れが生じた。 具体的には、depthwise畳み込み層は、通常の畳み込み層とは異なり、pyTorchがcuDNNライブラリを使用しないことを発見した。当初のアプローチでは、cuDNNライブラリを使用してすべての畳み込み層の時間をベンチマークすることが可能であると想定していたので、予測モデルでdepthwise畳み込み層の時間を考慮するために、アプローチを変更する必要があった。
|
今後の研究の推進方策 |
1. 実験に使っている全てのマシンにおいて、CNN学習時間を予測するモデルを構築し、25種類のPyTorchで実装されたCNNで予測精度の評価を行い、十分な予測性能を得られることを確認する。2022年度中に開発したアプローチにより、予測モデルの構築が当初より速くなったので全体的には予定通りに進捗できる見込みである。 2. 構築した予測モデルを以前研究代表者らが作成した GPU 搭載クラウド計算機の比較ツールと連携させる。この連携により、与えられた CNN に対して、学習時間と価格でクラウド計算機等を比較できるようにする。 3. 研究成果の取りまとめとその発表を行う。
|