信号処理的手法を用いた言語のモデル化に関する研究

Research Project

Project/Area Number	09780326
Research Category	Grant-in-Aid for Encouragement of Young Scientists (A)
Allocation Type	Single-year Grants
Research Field	Intelligent informatics
Research Institution	Nagoya University
Principal Investigator	武田一哉名古屋大学, 工学研究科, 助教授 (20273295)
Project Period (FY)	1997 – 1998
Project Status	Completed (Fiscal Year 1998)
Budget Amount *help	¥2,000,000 (Direct Cost: ¥2,000,000) Fiscal Year 1998: ¥1,000,000 (Direct Cost: ¥1,000,000) Fiscal Year 1997: ¥1,000,000 (Direct Cost: ¥1,000,000)
Keywords	音声認識 / 統計的言語モデル / 言語エントロピー / 統計的音声モデル / 特異値分解 / 単語・文脈クラスタリング / 大規模言語コーパス / 形態素解析 / 一般化ベルヌ-イ試行 / 連続音声認識 / 言語モデル / 単語パ-プレキシティー
Research Abstract	音声認識における、統計的言語モデルと統計的音声モデルとの統合過程において必要とされる、言語重みと単語挿入ペナルティーの理論的意味づけに取り組んだ。これらのパラメータはこれまで経験的な、調整パラメータとして扱われてきたが、両者が認識対象の音声文の言語エントロピーと、認識に用いた言語モデルと認識対象文とのクロスエントロピーとを調整する働きを持つパラメータであることを、理論的に示した。さらに、音声認識実験により、用意された2つの言語モデルに対して、上記の基準に基づき与えた異なる2つの言語重みパラメータにより、ほぼ最適な認識性能が得られることが明らかとなり、理論の正当性が実験的に確認された。単語間の接続性に基づき言語空間を探索するために、バイグラム行列の特異値分解に基づく、単語・文脈の線形部分空間表現を獲得した。具体的には、97年度に作成した、新聞記事データベースからバイグラム行列を作成し、ランク数を10〜3000程度まで変化させ、ランク数とバイグラムのエントロピーとの関係を調査し、300程度のランク(部分空間)で、単語・文脈双方の情報を効率的に表現可能なことを明らかにした。構成された部分空間が言語の意味を適切に表現していることは、部分空間上での単語・文脈クラスタリングが、エントロピーの削減に効率的であったことからも、確認された。具体的には、学習された部分空間上で、次元数を変化させ、空間の測度(ユークリッド距離)に基づき単語・文脈を独立にクラスタリングすることで、それぞれ最適なグループ分けを行なうことが可能なことを明らかにした。

Report

(2 results)

1998 Annual Research Report
1997 Annual Research Report

Research Products
(9 results)

All Other

All Publications (9 results)

[Publications] A.Ogawa,K.Takeda,F.Itakura: "Balencing Acoustic and Linguistic Probabilsties." Proc.of IEEE Inter Conf.Acoust Speach Siguel Proc.(ICASSP 98). 1. 181-184 (1998)
- Related Report
  1998 Annual Research Report
[Publications] K.Takeda,A.Ogawa,F.Itakura: "Estimating Entropy of a Language from Optimal Word Insertion tenalty" Proc,Intro Conf.Spoken Language Processing(ICSLP98). 5. 2095-2098 (1998)
- Related Report
  1998 Annual Research Report
[Publications] 小川・武田・板倉: "Word Insertior Penaltyによる言語確率の補正" 日本音響学会平成10年度春期研究発表会講演論文集. I. 17-18 (1998)
- Related Report
  1998 Annual Research Report
[Publications] 小川・武田・板倉: "一般化ベルヌーイ試行に基づく言語確率の補正方法" 電子情報通信学会誌. J81-DII 12. 2703-2711 (1998)
- Related Report
  1998 Annual Research Report
[Publications] 寺島、武田、板倉: "bigram行列の特異値分解による分析" 日本音響学会平成11年度春期研究発表会講演論文集. I. (1998)
- Related Report
  1998 Annual Research Report
[Publications] 小川・武田・板倉: "文長を考慮した言語モデルの検討" 情報処理学会、音声言語処理研究会資料. 16・5. 25-30 (1997)
- Related Report
  1997 Annual Research Report
[Publications] 小川・武田・板倉: "一般化ベルヌ-イ試行に基づく言語モデル" 音響学会全国大会講演論文集(平成9年度秋期). 2-1-1. 49-50 (1997)
- Related Report
  1997 Annual Research Report
[Publications] A.Ogawa, K.Takeda, F.Itakura: "A Language Model Based on Generalized Bernoulli Trials" Proc.of.Intem.Conf.on Speech Proc.ICSP‘97. 2. 765-770 (1997)
- Related Report
  1997 Annual Research Report
[Publications] A.Ogawa, K.Takeda, F.Itakura: "Language Modeling for Robust Balancing of Acoustic and Lingustic Probablities" Proc.of.IEEE Workshop on Automatic Speech and Understanding Recognition. 246-253 (1997)
- Related Report
  1997 Annual Research Report

信号処理的手法を用いた言語のモデル化に関する研究

Principal Investigator

武田 一哉 名古屋大学, 工学研究科, 助教授 (20273295)

¥2,000,000 (Direct Cost: ¥2,000,000)

Report

Research Products

[Publications] A.Ogawa,K.Takeda,F.Itakura: "Balencing Acoustic and Linguistic Probabilsties." Proc.of IEEE Inter Conf.Acoust Speach Siguel Proc.(ICASSP 98). 1. 181-184 (1998)

Related Report

[Publications] K.Takeda,A.Ogawa,F.Itakura: "Estimating Entropy of a Language from Optimal Word Insertion tenalty" Proc,Intro Conf.Spoken Language Processing(ICSLP98). 5. 2095-2098 (1998)

Related Report

[Publications] 小川・武田・板倉: "Word Insertior Penaltyによる言語確率の補正" 日本音響学会 平成10年度 春期研究発表会講演論文集. I. 17-18 (1998)

Related Report

[Publications] 小川・武田・板倉: "一般化ベルヌーイ試行に基づく言語確率の補正方法" 電子情報通信学会誌. J81-DII 12. 2703-2711 (1998)

Related Report

[Publications] 寺島、武田、板倉: "bigram行列の特異値分解による分析" 日本音響学会 平成11年度 春期研究発表会講演論文集. I. (1998)

Related Report

[Publications] 小川・武田・板倉: "文長を考慮した言語モデルの検討" 情報処理学会、音声言語処理研究会資料. 16・5. 25-30 (1997)

Related Report

[Publications] 小川・武田・板倉: "一般化ベルヌ-イ試行に基づく言語モデル" 音響学会 全国大会 講演論文集(平成9年度秋期). 2-1-1. 49-50 (1997)

Related Report

[Publications] A.Ogawa, K.Takeda, F.Itakura: "A Language Model Based on Generalized Bernoulli Trials" Proc.of.Intem.Conf.on Speech Proc.ICSP‘97. 2. 765-770 (1997)

Related Report

[Publications] A.Ogawa, K.Takeda, F.Itakura: "Language Modeling for Robust Balancing of Acoustic and Lingustic Probablities" Proc.of.IEEE Workshop on Automatic Speech and Understanding Recognition. 246-253 (1997)

Related Report

武田一哉名古屋大学, 工学研究科, 助教授 (20273295)

[Publications] 小川・武田・板倉: "Word Insertior Penaltyによる言語確率の補正" 日本音響学会平成10年度春期研究発表会講演論文集. I. 17-18 (1998)

[Publications] 寺島、武田、板倉: "bigram行列の特異値分解による分析" 日本音響学会平成11年度春期研究発表会講演論文集. I. (1998)

[Publications] 小川・武田・板倉: "一般化ベルヌ-イ試行に基づく言語モデル" 音響学会全国大会講演論文集(平成9年度秋期). 2-1-1. 49-50 (1997)