研究課題/領域番号 |
22KJ1345
|
補助金の研究課題番号 |
22J23373 (2022)
|
研究種目 |
特別研究員奨励費
|
配分区分 | 基金 (2023) 補助金 (2022) |
応募区分 | 国内 |
審査区分 |
小区分61040:ソフトコンピューティング関連
|
研究機関 | 東京工業大学 |
研究代表者 |
熊澤 峻悟 東京工業大学, 工学院, 特別研究員(DC1)
|
研究期間 (年度) |
2023-03-08 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
2,500千円 (直接経費: 2,500千円)
2024年度: 800千円 (直接経費: 800千円)
2023年度: 800千円 (直接経費: 800千円)
2022年度: 900千円 (直接経費: 900千円)
|
キーワード | 機械学習 / 深層学習 / アンサンブル学習 / エッジAI |
研究開始時の研究の概要 |
本研究は人間中心のAI社会の実現を目指し、スマートフォン等のエッジ環境に向けた持続的で環境適応可能な機械学習アルゴリズムの創出とその処理基盤の構築を目的とする。既存技術には推論処理のみをエッジ側で高速に行うものはあるが、持続的な環境適応のためには学習と推論を同時に行う必要があり、これを可能とする決定的な技術はまだない。そこで本研究では、近似計算に基づいた軽量な学習と推論を並行処理可能な手法の提案と、計算資源や電力に制約のあるエッジ環境での実行に向け、学習と推論の継続的同時利用を可能にするアーキテクチャの構築を目指す。
|
研究実績の概要 |
今年度の研究では、複数のエッジ端末を協力的に用いた推論手法(Edge Ensembles)の予測統合部分に関して、既存の代表的な高効率・高精度な3つの予測統合手法であるカスケード、重み付き平均法、Test Time Augmentation(TTA)の3つの手法を適用し効果を検証するとともに、これらの手法のEdge Ensemblesに適した改善手法を提案した。カスケードは複数のモデルを逐次的に推論し、予測に自信があると判断された場合に推論を途中で打ち切ることで、計算量を削減する手法である。推論を打ち切ることで計算量の削減が期待できるが、逐次的な処理によるレイテンシの増加が懸念される。本研究ではカスケードの並列数をmという変数にすることでレイテンシ増加と計算量削減のバランスを調整する、m並列カスケード手法を提案した。また、重み付き平均法・TTAに関して、事前に各モデルに対する重み・TTAのパラメータを設定せずに、エッジ側で推論データのみを用いて学習する手法を提案した。エッジ環境では正解ラベルがついた学習データが得られにくいという問題があり、この手法は、ラベルのないデータのみを用いて適応的にモデルの予測統合手法を高精度化する手法として提案した。 本研究では、認識精度・計算量・レイテンシの観点から評価を行った。実験を通して、Edge Ensemblesに対する既存の予測統合手法および提案手法の有効性について検証した。主な結果として、提案手法であるm並列カスケードは従来のカスケードと比較し、1.06倍の若干の計算量増加に対してレイテンシを1/2.8まで低下させた。さらに提案手法である、正解ラベルを使わずに重み付き平均・TTAのパラメータを学習する手法では、正解ラベル付きの学習データを用いた場合とほぼ同等の効果が得られ、エッジ環境におけるラベルなしデータを用いた最適化を可能にした。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究課題は、適応的なエッジAIに向け、近似計算手法に基づいた軽量な学習と推論を並行処理可能な手法の提案を目標としている。近似計算手法に基づいた学習・推論を行うモデルの精度低下に対して、複数の端末上のモデルの予測を統合することで高精度な予測を得るアンサンブル手法(Edge Ensembles)を用いて、精度を補う手法を検討していた。 今年度は昨年度より継続した、Edge Ensemblesの推論処理におけるモデル統合手法の違いがどのような条件下でどの程度精度に影響を与えるかの調査に加え、さらに既存のモデル統合手法を発展させた、よりEdge Ensemblesに適したモデル統合手法を提案した。また、適応的なエッジAIに向け、エッジ側でラベルのないデータを用いてEdge Ensemblesの予測統合部分のパラメータを学習する方法を提案した。これらの内容をまとめ、査読付き論文として発表した。以上の通り、研究はおおむね順調に進展している。
|
今後の研究の推進方策 |
今年度の研究では、適応的なエッジAIに向け、Edge Ensemblesのモデル統合部分のパラメータについてエッジ側でラベルのないデータを用いた最適化方法を提案したが、実用的な応用を考えた場合に、エッジ環境で得られる学習データの量や質に関する問題がある。現在この問題に対して、生成モデルを用いた学習データの生成が利用できないか検討している。生成モデルは学習データの生成以外にも、データのプライバシー性の向上やデータ圧縮などに利用ができ、エッジ環境での応用が期待される技術である。現在生成モデルの一つである拡散確率モデルに着目し、その最新の動向を調査しており、今後は適応的なエッジAIにおける生成モデルの効率的利用方法およびエッジ環境での実行に向けた軽量化方法について検討していく予定である。
|