研究課題/領域番号 |
20K11999
|
研究機関 | 関西大学 |
研究代表者 |
肥川 宏臣 関西大学, システム理工学部, 教授 (10244154)
|
研究期間 (年度) |
2020-04-01 – 2023-03-31
|
キーワード | 画像認識 / 自己組織化マップ / 過学習 / MNIST / ハードウェアアクセラレータ |
研究実績の概要 |
提案する階層化ふるい分け自己組織化マップ(Self-organizing map: SOM)による画像の認識手法の提案を行った. SOM は,入力されるデータをデータ相互の類似性によりグループに分けるクラスタリングを行う特性を持つ.ふるい分け SOM では,このクラスタリング能力を利用して SOM で画像を荒く分類し,さらに 別の SOM で分類する.これを繰り返すことで画像分類の精度を高め,高精度の画像認識が行えると考えた.現在,深層学習モデルが画像認識では広く研究されている.しかし,深層学習モデルは非常に高性能な画像認識が可能であるが,内部構造や動作がブラックボックス化され,どのような処理が行われて結果を得たのかがわからないという問題がある.提案手法は,シンプルで動作が分かり易い特徴がある. 手書き文字のデータベースである MNIST データセットを使って,提案システムの認識性能を調べた.ふるい分けを行う SOM の層数と各層の SOM のニューロン数を調整することで,認識性能は徐々に改善されることを確認した.しかし,深層学習モデルの認識率が99%以上に対して,提案するふるい分けSOM だけだと MNIST の認識率は約95%止まりとなってしまったため,大幅な計画変更が必要と考えている. 一方,実行速度改善のため,プログラム可能である Field Programmable Gate Array (FPGA) によるハードウェアアクセラレータの開発に関しては,入れ子構造のハードウェア SOM を提案している.これは,SOM の拡張性を改善したもので,国際会議(IEEE ICECS2020) で成果発表を行った.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
提案する階層化ふるい分け SOM による画像の認識実験を手書き文字のデータベースである MNIST データセットを用いて行った.このデータセットは60000枚の学習データと10000枚のテストデータで構成される.ふるい分けを行う SOM の層数と各層の SOM のニューロン数を調整することで,認識性能が徐々に改善されることを確認した.最終的に,95%の認識性能が得られた.しかし,認識性能がある程度まで向上すると過学習により認識率の改善が止まってしまうことが分かった.認識システムの学習では,正解のクラスが分かっている学習データの認識率が向上するように SOM 内の係数調整を行う.そして,正解が未知のテストデータを用いてシステムの認識性能評価を行う.過学習状態になると,学習データの認識率が上がってもテストデータの認識率が改善されない状態となる.比較対象としている深層学習モデルの認識率が99%以上に対して,提案するふるい分けSOM の認識率は約95%止まりとなってしまったため,さらなる改良が必要である. 予期しなかった提案システムの長所として,通常の SOM に比べて実行速度を大幅に改善することができた.SOM 内部のニューロン数に比例して計算コストが大きくなる.ふるい分け SOM の場合,ニューロン数が多くてもそれらを分割して複数の SOM に割り当てるため,計算コストが小さい SOM を複数実行することになり,トータルの計算コストが小さくなるためである. 認識システムの速度改善のために,アクセラレータとして入れ子構造のハードウェア SOM を提案している.これはモジュールを階層化させた構造で,モジュールは24個のサブモジュールで構成され,モジュールの層を1つ増やすことで SOM に含まれるニューロンが4倍となるため,簡単に大規模の SOM を実装することができる.
|
今後の研究の推進方策 |
提案システムの認識性能を改善するために,次に挙げる改善を行う.(1) まず,これまでの実験で明らかになったふるい分け SOM の問題点である過学習を防ぐ仕組みを考える. 過学習の原因は学習データとテストデータでばらつきがあるためである.データ全体のばらつきを減らすため,画像に対する前処理を導入する.ばらつきとしては,画像に含まれる手書き数字の大きさ,位置,角度,線の太さがある.これらの要素に対して正規化を行うことで画像のばらつきを少なくする.(2) 別の SOM を用いた認識システムにふるい分け SOM を用いる.SOM を用いた認識システムとして,認識クラス数ぶんの SOM を用いたシステムを考えている.このシステムでは,各 SOM を別々のクラスに割り当て,そのクラスのみの学習データで学習させる.認識時には,すべての SOM に対する類似度から認識結果を求める.これに,ふるい分け SOM を組み合わせることにより,認識性能の向上を目指す. また,ハードウェア SOM の開発も並行して行う.開発中の入れ子構造のハードウェア SOM にパイプライン処理による時間並列性と複数のプロセッサによる空間並列性を導入することで,SOM の拡張性に加え,さらなる高速化を図る.また,SOM をハードウェア記述言語でモデル化した後,論理合成を行うことでハードウェア開発を行っているが,予備実験では入れ子構造にすることで,従来のフラットな構造より高速動作する回路が得られた.これについて精査する.
|
次年度使用額が生じた理由 |
当該年度は世界的なパンデミックのため,出席を予定していた国際会議,国内会議がリモート開催となった.そのため,予定していた旅費が不要となり次年度使用額が生じてしまった.次年度はシステム開発用に高速なワークステーションの購入を予定していたが,次年度使用額と翌年度分として請求した助成金と合わせて,よりハイスペックなワークステーションの購入と成果発表の費用(国際ジャーナルへの論文掲載と英文校閲)に充てる計画である.
|