従来のアリストテレス、ニュートン以来の演繹ベースによる科学的推論のパラダイムに対するオルターナティヴとして、研究代表者(田邉)によって企図・開発された汎帰納機械Penalized Logistic Regression Machine (PLRM)の帰納推論能力を、音声データに基づく話者特定の問題に通じて検証した。 従来この音声認識分野において最も有効とされ標準的となっている方法は、音声特徴抽出のための長年にわたる研究において確立されたデータの非線形前処理(メルケプストラム化等)を用いて、26次元に次元縮約された特徴データに基づき、各話者の特徴データから各話者の26次元分布関数を、混合ガウス分布モデル(GMM)によって推定し、与えられた未知話者の音声特徴データにたいして、最大尤度をもたらす話者候補を発声者と特定する方法である。これに対し、このような特徴抽出や次元縮約などの前処理を経ないで、256次元の音声データを直接、汎帰納機械の双対機械であるdPLRMに入力することにより、データから話者弁別のための特徴を帰納することが可能であるかを実験し、上記の標準的方法よりも優れた性能があることを示した。この事実は、科学的推論における帰納推論の新しい可能性を示したものと考えることが出来る。 dPLRMと同様の機能を持った方法の一つに、Support Vectoe Machine (SVM)があり、近年その有効性が認められ、多くの成功的適用例が報告されている。本研究においては、上記の話者認問題に対する、dPLRMとSVMの性能比較を行い、dPLRMがSVM同等以上の能力を持つことを示した。
|