研究課題/領域番号 |
18K19789
|
研究機関 | 早稲田大学 |
研究代表者 |
森 達哉 早稲田大学, 理工学術院, 教授 (60708551)
|
研究期間 (年度) |
2018-06-29 – 2020-03-31
|
キーワード | セキュリティ / 音声 / 音声アシスタント / 音声認識 / 攻撃 / 機械学習 |
研究実績の概要 |
本年度は音声セキュリティの研究に関する基礎検討に取り組み、音声信号を周囲の人間に対して秘匿した状態で音声アシスタントに入力する攻撃の実証評価と、その対策技術の開発に取り組んだ。周囲の人間に対して秘匿する方法として、指向性スピーカを2つ使う手法を提案した。具体的には所望の音声信号を搬送波と側帯波に分離した上で、それぞれを個別の指向性スピーカから送信し、ある一点で音波を交差させる。これにより、交差点でのみ聴き取りが可能な音声信号を構成することが可能である。このような設定で音声を発生した場合、周囲の人間にはほとんど聴き取れないにもかかわらず、交差点がターゲットとなる音声アシスタント機器のマイク位置と一致すれば攻撃が成立することを確認することができた。対策技術としては、音声スペクトログラム情報を用いた機械学習により、人間が発生した音声と、機械が発生した音声を識別する手法を評価した。特徴量としては音声認識に用いられるメル周波数ケプストラム係数(MFCC, Mel Frequency Cepstram Coefficients)を利用した。音声1フレームあたりの次元数は40である。このような条件の元、深層学習(CNN)を用いた訓練、検証を行った結果、超音波成分を含む指向性スピーカと肉声は100%の精度で識別が可能であったものの、ダイナミックスピーカから発生した音声と肉声の識別精度は50%程度にとどまった。これはMFCCでは十分にダイナミックスピーカと肉声の違いを表現できていないことを示唆している。肉声とダイナミックスピーカから発生した音声の識別は2019年度の残課題となった。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
研究業績の点では良好な成果を得ている。具体的には、概要で示した研究成果を情報処理学会のコンピュータセキュリティシンポジウムで発表し、最優秀論文賞を受賞している。また、まとめた成果をIEEEの論文誌に投稿し、2019年5月時点で条件付き採録となっている。 当初予定した内容に加え、音声アプリの解析を実施している。その成果は2019年度に公表予定であるが、良好な成果を得ている。
|
今後の研究の推進方策 |
人間が実際に発生する肉声、およびダイナミックスピーカから発生する再生音声、もしくは合成音声を識別する技術の開発に取り組む。基本的なアイディアは、音声信号のみならず、音声アシスタント装置が具備する各種のセンサー読み取り値を使う点にある。また、音声アシスタントで動作するアプリの解析に取り組む。これらのアプリは人間の音声を入力とすること、およびロジックがクラウド側で動作する点に特徴があり、これまでのアプリとは大きく異なる。そのような音声アプリにおける悪性アプリとはどのようなものであるか、そのような悪性アプリを検出するためにはどのような技術が必要であるかを検討する。
|
次年度使用額が生じた理由 |
当初購入を予定していた実験に必要な装置を学内で借りることができたため、その分の支出を少なくすることができた。支出を減らした分は不足していた旅費に充当する予定である。
|