1998 Fiscal Year Annual Research Report
日本語ディクテーションシステムの環境への適応化アルゴリズムの研究および評価
Project/Area Number |
10680382
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
鹿野 清宏 奈良先端科学技術大学院大学, 情報科学研究科, 教授 (00263426)
|
Co-Investigator(Kenkyū-buntansha) |
陸 金林 奈良先端科学技術大学院大学, 情報科学研究科, 助手 (50230868)
中村 哲 奈良先端科学技術大学院大学, 情報科学研究科, 助教授 (30263429)
|
Keywords | ディクテーション / 話者適応 / タスク適応 |
Research Abstract |
統計的言語モデルのタスク適応化の研究と、音響モデルの発声環境適応化の研究を並行して進めた。以下、研究の進展状況をまとめておく。 (1) 統計的言語モデルのタスク適応化 (a) 形態素解析プログラムChaSenの改良と読みの付与プログラムChaWanの作成をIPAのプロジェクトと共同で行った。 (b) ChaSenとChaWanの結果を用いて言語モデル(単語トライグラム)の作成を行い、従来より精度よくかつ効率よく作成できるようになった。 (c) クロスエントロピーによる評価尺度を用いて、単語トライグラムの性能を下げずにパラメータを1/3〜1/10に圧縮するアルゴリズムを考案し、2万語のディクテーションシステムで有効性を評価した。 (d) クロスエントロピーによる評価尺度によるタスク適応アルゴリズムを提案した。 (e) 4年分の新聞記事からの言語モデルと7年分の新聞記事からの言語モデルの比較を行い、7年分の言語モデルがあきらかに優れていることを確認した。 (2) 音韻モデルの適応アルゴリズム (a) ディクテーション用のHMM音韻モデルの適応プログラム(NOVO)を作成した。 (b) ハンズフリー音声認識の残響への適応アルゴリズムの研究を行った。 基本的な言語モデルのタスク適応化アルゴリズムとHMM音韻モデルの環境適応アルゴリズムの基本プログラムを作成したので、実環境の音声データをさらに収録して、アルゴリズムの本格的な評価を行う予定である。
|
Research Products
(16 results)
-
[Publications] 滝口哲也、中村哲、鹿野清宏、: "雑音・残響環境下でのHMM分解・合成法によるモデル適応化" 電子情報通信学会論文誌. D-II,No.10. 2331-2238 (1998)
-
[Publications] Tetsuya Takiguchi,Satoshi Nakamura,and Kiyohiro Shikano,M.Morishima,T.Isobe,: "Evaluation of Model Adaptation by HMM Decomposition on Telephone Speech Recongnition" Proc.ICSLP'98. 1507-1510 (1998)
-
[Publications] Norimichi Yodo,Kiyohiro Shikano and Satoshi Nakamura,: "Compression Algorithm of Trigram Language Models based on Maximum Likelihood Estimation" Proc.Internat.Conf.on Spoken Language Process.,. 1683-1686 (1998)
-
[Publications] Takeshi Yamada,Satoshi Nakamura,Kiyohiro Shikano,: "An Effect of Adaptive Beamforming on Hands-free Speech Recognition Based on 3-D Viterbi Search" Proc.Internat.Conf.on Spoken Language Process.,. 381-384 (1998)
-
[Publications] T.Kawahara,T.Kobayashi,K.Takeda,N.Minematsu,K.Itou,M.Yamamoto,A.Yamada,T.Utsuro,K.Shikano: "Sharable Software Repository for Japanese Large Vocabulary Continuous Speech Recognition" Proc.Internat.Conf.on Spoken Language Process.,. 117-122 (1998)
-
[Publications] 滝口哲也、中村哲、鹿野清宏、森島昌俊、磯部俊洋、: "電話音声認識におけるHMM分解・合成法の性能評価" 電子情報通信学会音声研究会. SP98-28. 39-44 (1998)
-
[Publications] 踊堂憲道、山本俊一郎、鹿野清宏、中村哲、: "最尤推定尺度によるN-gramのタスク適応" 日本音響学会講演論文集. 59-60 (1999)
-
[Publications] 山本俊一郎、伊藤克亘、山田篤、宇津呂武仁、鹿野清宏、: "ディクテーションにおける形態素辞書エントリと読みの整備の効果" 日本音響学会講演論文集. 53-54 (1999)
-
[Publications] 山本俊一郎、伊藤克亘、鹿野清宏、中村哲、: "ディクテーションにおける日本語の特質を考慮した単語正解率判定ツール" 日本音響学会講演論文集. 155-156 (1999)
-
[Publications] 廣瀬良文、伊藤克亘、鹿野清宏、中村哲、: "「読み」を考慮した言語モデルによる大語彙連続音声認識" 日本音響学会講演論文集. 55-56 (1999)
-
[Publications] 踊堂憲道、鹿野清宏、中村哲、: "情報量に基づくtrigramパラメータの逐次的削減手法" 情報処理学会音声言語処理研究会,. SLP22-17. 91-97 (1998)
-
[Publications] 伊藤、河原、武田、鹿野、: "日本語ディクテーション基本ソフトウエア" 人工知能学会全国大会論文集. 26-14. 449-452 (1998)
-
[Publications] 山本俊一郎,踊堂憲道,中村哲,鹿野清宏,伊藤克亘(電総研),: "形態素解析結果の後処理により改良された統計的言語モデルの評価" 日本音響学会講演論文集,. 69-70 (1998)
-
[Publications] 武田、河原、伊藤、鹿野、: "日本語ディクテーション基本ソフトウエア" 情報処理学会第57回全国大会、. 461-462 (1998)
-
[Publications] 杉本浩史、山本英里、中村哲、鹿野清宏、: "ストリーム重みの制御による異種パラメータの統合法の検討" 日本音響学会講演論文集. 85-86 (1999)
-
[Publications] 杉村耕司、滝口哲也、中村哲、鹿野清宏、: "フレーム間の関係を考慮した残響音声認識の検討" 日本音響学会講演論文集. 127-128 (1999)