• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

1998 年度 実績報告書

信号処理的手法を用いた言語のモデル化に関する研究

研究課題

研究課題/領域番号 09780326
研究機関名古屋大学

研究代表者

武田 一哉  名古屋大学, 工学研究科, 助教授 (20273295)

キーワード音声認識 / 統計的言語モデル / 言語エントロピー / 統計的音声モデル / 特異値分解 / 単語・文脈クラスタリング
研究概要

音声認識における、統計的言語モデルと統計的音声モデルとの統合過程において必要とされる、言語重みと単語挿入ペナルティーの理論的意味づけに取り組んだ。これらのパラメータはこれまで経験的な、調整パラメータとして扱われてきたが、両者が認識対象の音声文の言語エントロピーと、認識に用いた言語モデルと認識対象文とのクロスエントロピーとを調整する働きを持つパラメータであることを、理論的に示した。さらに、音声認識実験により、用意された2つの言語モデルに対して、上記の基準に基づき与えた異なる2つの言語重みパラメータにより、ほぼ最適な認識性能が得られることが明らかとなり、理論の正当性が実験的に確認された。
単語間の接続性に基づき言語空間を探索するために、バイグラム行列の特異値分解に基づく、単語・文脈の線形部分空間表現を獲得した。具体的には、97年度に作成した、新聞記事データベースからバイグラム行列を作成し、ランク数を10〜3000程度まで変化させ、ランク数とバイグラムのエントロピーとの関係を調査し、300程度のランク(部分空間)で、単語・文脈双方の情報を効率的に表現可能なことを明らかにした。構成された部分空間が言語の意味を適切に表現していることは、部分空間上での単語・文脈クラスタリングが、エントロピーの削減に効率的であったことからも、確認された。具体的には、学習された部分空間上で、次元数を変化させ、空間の測度(ユークリッド距離)に基づき単語・文脈を独立にクラスタリングすることで、それぞれ最適なグループ分けを行なうことが可能なことを明らかにした。

  • 研究成果

    (5件)

すべて その他

すべて 文献書誌 (5件)

  • [文献書誌] A.Ogawa,K.Takeda,F.Itakura: "Balencing Acoustic and Linguistic Probabilsties." Proc.of IEEE Inter Conf.Acoust Speach Siguel Proc.(ICASSP 98). 1. 181-184 (1998)

  • [文献書誌] K.Takeda,A.Ogawa,F.Itakura: "Estimating Entropy of a Language from Optimal Word Insertion tenalty" Proc,Intro Conf.Spoken Language Processing(ICSLP98). 5. 2095-2098 (1998)

  • [文献書誌] 小川・武田・板倉: "Word Insertior Penaltyによる言語確率の補正" 日本音響学会 平成10年度 春期研究発表会講演論文集. I. 17-18 (1998)

  • [文献書誌] 小川・武田・板倉: "一般化ベルヌーイ試行に基づく言語確率の補正方法" 電子情報通信学会誌. J81-DII 12. 2703-2711 (1998)

  • [文献書誌] 寺島、武田、板倉: "bigram行列の特異値分解による分析" 日本音響学会 平成11年度 春期研究発表会講演論文集. I. (1998)

URL: 

公開日: 1999-12-11   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi