1995 Fiscal Year Annual Research Report
Project/Area Number |
07558042
|
Research Category |
Grant-in-Aid for Developmental Scientific Research (B)
|
Research Institution | Tohoku University |
Principal Investigator |
牧野 正三 東北大学, 大型計算機センター, 教授 (00089806)
|
Co-Investigator(Kenkyū-buntansha) |
二矢田 勝行 松下技研(株)ヒューマンインターフェイス研究所, 所長
木幡 稔 東北大学, 大学院・工学研究科, 助教授 (30186720)
|
Keywords | 連続音声認識 / 識別学習 / 音素認識 / 言語モデル |
Research Abstract |
本年度は,「音声入力による公文書作成支援装置」の音響処理部の開発に重点を置いて研究を行った.本研究では,神経回路網の一つである識別学習に基づく音素認識法を開発した.従来の識別学習法では,固定長パターンを対象として研究が行われてきたが,音素認識に適用する場合は,可変長パターンに対して識別学習を適用する必要がある.そのためには,(1)複数パターンの平均化法,(2)パターンのクラスタリング法,(3)パターンの修正法,の3つの問題を解決する必要がある.パターン間の距離尺度としてはDP距離尺度を用いた.複数パターンの平均化法としては,長さの近いもの同士の平均化を繰返して単一のパターンとする方法と,平均的な長さのパターンに統合して行く方法の2方法を提案し比較した.パターンのクラスタリング法としては,各音素独立に行う方法と,音素相互間の分布を考慮して行う方法を提案し比較した.パターンの修正法としては.我々が提案した修正LVQ2法を用いた.音素認識実験によって比較した結果,複数パターンの平均化法としては,平均的長さのパターンに統合して行く方法がよく,クラスタリングの方法としては音素相互間の分布を考慮した方法がよいことがわかった.また標準パターンは前後30ms程度を付加して作成した方がよいことも明らかになった.その結果,固定長パターンでは,78.8%であった音素認識率が80.2%へと向上した.さらに,この標準パターンを用いて連続音声をセグメンテーションに認識する方法を提案した.2段DPマッチングを連接確立と持続時間長の確率を考慮できるように拡張した.認識率68.1%,付加率12.5%,脱落率4.2%という値が得られた.
|
Research Products
(6 results)
-
[Publications] 古賀,牧野,城戸: "ローカルピークによる単母音認識に及ぼす時間窓とリフタの影響" 日本音響学会誌. 51. 130-132 (1995)
-
[Publications] 伊藤,牧野: "拡張RHA法による連続音声認識のための単語予備選択" 電子情報通信学会論文誌D-II. J-78-D-II. 400-408 (1995)
-
[Publications] M.SUZUKI,S.MAKINO,H.ASO,H.SHIMODAIRA: "A New HMnet Construction Algorithm Requining No Contextual Factors" IEICE Traus, INF. & SYST.E-78-D. 662-668 (1995)
-
[Publications] 鈴木,牧野,阿曽: "離散型HMnetの言語モデルへの適用" 電子情報通信学会技術研究報告. SP95-33. 65-72 (1995)
-
[Publications] 沖本,牧野,曽根: "確率尺度によるDPマッチングを用いた音素のセグメンテーション" 日本音響学会講演論文集. I. 165-166 (1995)
-
[Publications] 大坂,牧野,曽根: "予備認識結果に基づく持続時間予測の音素認識における効果" 日本音響学会講演論文集. I. 55-56 (1995)