本研究課題では、深層学習で従来用いられる計算原理とは全く異なる、常微分方程式に基づく技術(Neural ODE)を採用し、それをアナログ回路で実装した超低消費電力の深層学習専用LSIチップを開発する事を目標としている。 2020年度は、提案技術が有効となるアプリケーションの検討を行い、その結果、キーワードスポッティング(事前に定義したキーワードを入力音声から検出)を対象とすることに決定した。Neural ODEは、これまで音声認識の分野に適用されていなかった為、まず、アルゴリズム検討を行った。その結果、Neural ODEを適用することで、ニューラルネットワークのパラメータ数を68%削減する手法の提案を行った。これにより、キーワード音声検出の低消費電力化が期待できる。 2021年度から2022年度にかけて、キーワードスポッティング専用回路の開発を行なった。キーワードスポッティングでは、マイクから入力される音声に対して、特徴量を抽出し、識別器によりキーワードを検出する。従来のキーワードスポッティング専用回路は、マイクから入力されたアナログ音声信号を、ADC(アナログ・デジタル変換器)でデジタル信号に変換し、特徴量抽出と識別器をデジタル回路で実装する。そして、特徴量には、MFCC(メル周波数ケプストラム係数)を用いる事が一般的である。一方、この方式には、ADCとMFCC導出に必要な消費電力が大きい、という課題があった。そこで、本研究では、次の3点を特徴とする回路技術の提案を行なった。1)MFCCを複数のバンドパスフィルターに置き換え、2)深層学習ベースの特徴量抽出手法を提案、3)これらをアナログ回路で実現することでADCを除去する。本回路技術を実装したチップを試作し、従来技術に比べて、消費電力を50%削減できることを、実チップで検証した。
|