1998 Fiscal Year Annual Research Report
Project/Area Number |
09780326
|
Research Institution | Nagoya University |
Principal Investigator |
武田 一哉 名古屋大学, 工学研究科, 助教授 (20273295)
|
Keywords | 音声認識 / 統計的言語モデル / 言語エントロピー / 統計的音声モデル / 特異値分解 / 単語・文脈クラスタリング |
Research Abstract |
音声認識における、統計的言語モデルと統計的音声モデルとの統合過程において必要とされる、言語重みと単語挿入ペナルティーの理論的意味づけに取り組んだ。これらのパラメータはこれまで経験的な、調整パラメータとして扱われてきたが、両者が認識対象の音声文の言語エントロピーと、認識に用いた言語モデルと認識対象文とのクロスエントロピーとを調整する働きを持つパラメータであることを、理論的に示した。さらに、音声認識実験により、用意された2つの言語モデルに対して、上記の基準に基づき与えた異なる2つの言語重みパラメータにより、ほぼ最適な認識性能が得られることが明らかとなり、理論の正当性が実験的に確認された。 単語間の接続性に基づき言語空間を探索するために、バイグラム行列の特異値分解に基づく、単語・文脈の線形部分空間表現を獲得した。具体的には、97年度に作成した、新聞記事データベースからバイグラム行列を作成し、ランク数を10〜3000程度まで変化させ、ランク数とバイグラムのエントロピーとの関係を調査し、300程度のランク(部分空間)で、単語・文脈双方の情報を効率的に表現可能なことを明らかにした。構成された部分空間が言語の意味を適切に表現していることは、部分空間上での単語・文脈クラスタリングが、エントロピーの削減に効率的であったことからも、確認された。具体的には、学習された部分空間上で、次元数を変化させ、空間の測度(ユークリッド距離)に基づき単語・文脈を独立にクラスタリングすることで、それぞれ最適なグループ分けを行なうことが可能なことを明らかにした。
|
-
[Publications] A.Ogawa,K.Takeda,F.Itakura: "Balencing Acoustic and Linguistic Probabilsties." Proc.of IEEE Inter Conf.Acoust Speach Siguel Proc.(ICASSP 98). 1. 181-184 (1998)
-
[Publications] K.Takeda,A.Ogawa,F.Itakura: "Estimating Entropy of a Language from Optimal Word Insertion tenalty" Proc,Intro Conf.Spoken Language Processing(ICSLP98). 5. 2095-2098 (1998)
-
[Publications] 小川・武田・板倉: "Word Insertior Penaltyによる言語確率の補正" 日本音響学会 平成10年度 春期研究発表会講演論文集. I. 17-18 (1998)
-
[Publications] 小川・武田・板倉: "一般化ベルヌーイ試行に基づく言語確率の補正方法" 電子情報通信学会誌. J81-DII 12. 2703-2711 (1998)
-
[Publications] 寺島、武田、板倉: "bigram行列の特異値分解による分析" 日本音響学会 平成11年度 春期研究発表会講演論文集. I. (1998)