日本語音声認識のための統計的言語モデルとそのタスク適応に関する研究

Research Project

Project/Area Number	09780307
Research Category	Grant-in-Aid for Encouragement of Young Scientists (A)
Allocation Type	Single-year Grants
Research Field	Intelligent informatics
Research Institution	Yamagata University
Principal Investigator	伊藤彰則山形大, 工学部, 講師 (70232428)
Project Period (FY)	1997 – 1998
Project Status	Completed (Fiscal Year 1998)
Budget Amount *help	¥2,000,000 (Direct Cost: ¥2,000,000) Fiscal Year 1998: ¥900,000 (Direct Cost: ¥900,000) Fiscal Year 1997: ¥1,100,000 (Direct Cost: ¥1,100,000)
Keywords	統計的言語モデル / 形態素解析 / 読み付与 / 連続音声認識
Research Abstract	今年度の研究では,「日本語連続音声認識のための形態素解析によらない統計的言語モデル」の研究を行った.この研究は2つのサブテーマから成っている.一つは統計的に選ばれた文字列を単位とした言語モデルの作成であり,もう一つは統計的手法に基づく漢字かな混じり文への読みの付与である. 文字列を単位とした言語モデルの作成においては,提案法の評価実験として,さまざまな文字列への分割方法の比較実験,および学習テキストと評価テキストのタスクと規模を変えた実験を行った.その結果,頻度による文字列の抽出と左最長一致法による解析の組み合わせにおいて,もっとも大きいパ-プレキシティ低減効果(最大9.3%)が見られた.また,コーパスによる性能差を見るために,3種類の対話コーパスと,書き言葉であるEDRコーパスを用いた比較実験を行った.その結果,単一タスクであるATR会話コーパスにおけるパ-プレキシティ低減率がもっとも大きかった.これは,学習テキストのみから統計量の推定と分割単位の双方を決定するためであり,本手法の適用限界を示すものと言うことができる. 統計的な手法を用いた読みの付与では,EDRコーパスを用いて,N-gramモデルを応用した読み付与システムを作成し評価した.その結果,当該文字の前後1文字を用いてモデルを作成した場合が最も高性能であることが明らかとなった.システムの最高性能として96.27%の読み付与精度が得られた.

Report

(1 results)

1997 Annual Research Report

Research Products
(1 results)

All Publications (1 results)

[Publications] 伊藤彰則, 好田正紀: "かな・漢字文字列の連鎖統計による言語モデル" 電子情報通信学会論文誌. J79-D-II・No12. 2062-2069 (1996)
- Related Report
  1997 Annual Research Report