本研究では、発話を入力としたコンピュータによる大人・子ども識別法を開発した。本研究の実施内容には、提案法のアルゴリズムの改良の他、ウェブサービスとして実際に動作するシステムを開発し、評価することを含む。本年度は、下記、2項目を中心に提案システムの実用性向上を目指した研究開発を行った。 (1) 聴覚特徴の抽出と識別アルゴリズムへの組み込み:昨年度に引き続き、識別アルゴリズムに深層学習のニューラルネットワーク(DNN)の導入を検討した。DNNにおいて、従来型のアルゴリズムである隠れマルコフモデル(HMM)と同様の時間伸縮を扱う方法について検討を加えた。また、昨年度実施したデモシステムの開発段階において、聴覚特徴の抽出処理におけるアルゴリズムの高度化やデータ処理量増加に伴うシステム全体の処理時間増加が問題となっていた。メルフィルタバンクなどの簡易な特徴量との比較を追加するなど多角的な分析を加えた。また、聴覚特徴の抽出処理自体にも、計算スピードの高速化に向けた改良の検討をはじめた。 (2) 公開試験に向けたウェブサービスとしてのシステム改良:提案システムの本格的な公開に向けて、システムの改良を行った。これまでに行った提案法をウェブサーバ側プログラムに適用することで、最新の研究成果を広く公開できるようにした。同時に、これまでのデモシステムは、主にPC端末向けに開発してきたが、より多くの利用者を獲得するために、Android端末でも提案システムが動作するように改良を加えた。また、音声入力のユーザインタフェースを設計する際のデザインについて実験を通じて検討を加えた。これは、音声入力ユーザインタフェースに慣れていない利用者が適切に本システムを利用できるようにするための改良である。ユーザビリティを向上し、多くの人に利用してもらうのに必要な検討であり、有意義な知見を得ることができた。
|