音声認識における、統計的言語モデルと統計的音声モデルとの統合過程において必要とされる、言語重みと単語挿入ペナルティーの理論的意味づけに取り組んだ。これらのパラメータはこれまで経験的な、調整パラメータとして扱われてきたが、両者が認識対象の音声文の言語エントロピーと、認識に用いた言語モデルと認識対象文とのクロスエントロピーとを調整する働きを持つパラメータであることを、理論的に示した。さらに、音声認識実験により、用意された2つの言語モデルに対して、上記の基準に基づき与えた異なる2つの言語重みパラメータにより、ほぼ最適な認識性能が得られることが明らかとなり、理論の正当性が実験的に確認された。 単語間の接続性に基づき言語空間を探索するために、バイグラム行列の特異値分解に基づく、単語・文脈の線形部分空間表現を獲得した。具体的には、97年度に作成した、新聞記事データベースからバイグラム行列を作成し、ランク数を10〜3000程度まで変化させ、ランク数とバイグラムのエントロピーとの関係を調査し、300程度のランク(部分空間)で、単語・文脈双方の情報を効率的に表現可能なことを明らかにした。構成された部分空間が言語の意味を適切に表現していることは、部分空間上での単語・文脈クラスタリングが、エントロピーの削減に効率的であったことからも、確認された。具体的には、学習された部分空間上で、次元数を変化させ、空間の測度(ユークリッド距離)に基づき単語・文脈を独立にクラスタリングすることで、それぞれ最適なグループ分けを行なうことが可能なことを明らかにした。
|