1995 Fiscal Year Annual Research Report
Project/Area Number |
07557041
|
Research Category |
Grant-in-Aid for Developmental Scientific Research (B)
|
Research Institution | Fukushima Medical University |
Principal Investigator |
平岩 幸一 福島県立医科大学, 医学部, 教授 (60124616)
|
Co-Investigator(Kenkyū-buntansha) |
二矢田 勝行 松下技研(株), ヒューマンインターフェイス研究所, 所長
牧野 正三 東北大学, 大型計算機センター, 教授 (00089806)
勾坂 馨 東北大学, 医学部, 教授 (70006740)
|
Keywords | 連続音声認識 / HMnet / 音素認識 / 言語モデル |
Research Abstract |
本年度は「剖検所見の音声入力化装置」の音素認識部の開発に重点を置いた。音素認識の方法としては、最近よく用いられているHMM(Hidden Markov Model)に基づく方法を採用した。HMMでも前後の音素環境と学習サンプル数を考慮したHM-netという方法がもっともよく用いられている。我々は、このHM-netを構築する方法の問題点を指滴し、欠点を克服した新たなHM-net構築法を提案した。すなわち、音響的類似性を基にしてHM-netを構築する方法である。同じ学習サンプルに対して、従来の方法で構築したHM-netと我々の方法で構築したHM-netの構造を比較したところ、従来の方法ではHM-netが構築できない音素が存在していたが、我々の方法では、全ての音素についてHM-netが構築でき、かつ音素の物理的性質をよく表していることが明らかになった。次に、音素認識実験によって我々の方法の有効性を認識した。2種類の音素グループに対して特定話者音素認識実験を行った。音声は12kHzでサンプリングされ、フレーム周期5msで対数パワーやケプストラムからなる34次元ベクトルに変換された。この34次元ベクトルの系列を用いて従来の方法と我々の提案した方法でそれぞれHM-netを構築した。8人の話者が発声した/b,d,g,m,n,N/の6子音の音素認識実験では、音素認識率は従来の方法で90.6%、我々の提案した方法で91.5%であった。4人の話者の発声した全音素の認識実験では、従来の方法で91.3%,我々の方法で93.1%といずれの実験でも高い音素認識率を得ることができた。
|
-
[Publications] 古賀,牧野,城戸: "ローカルピークによる単母音認識に及ぼす時間窓とリフタの影響" 日本音響学会誌. 51. 130-132 (1995)
-
[Publications] 伊藤,牧野: "拡張RHA法による連続音声認識のための単語予備選択" 電子情報通信学会論文誌D-II. J-78-D-II. 400-408 (1995)
-
[Publications] M.SUZUKI,S.MAKINO,H.ASO,H.SHIMODAIRA: "A New HMnet Construction Algorithm Requireng No Contextual Factors" IEICE Trans. INF.& SYST.E-78-D. 662-668 (1995)
-
[Publications] 鈴木,牧野,阿曽: "離散型HMnetの言語モデルへの適用" 電子情報通信学会技術研究報告. SP95-33. 65-72 (1995)
-
[Publications] 沖本,牧野,曽根: "確率尺度によるDPマッチングを用いた音素のセグメンテーション" 日本音響学会講演論文集. I. 165-166 (1995)
-
[Publications] 大坂,牧野,曽根: "予備認識結果に基づく持続時間予測の音素認識における効果" 日本音響学会講演論文集. I. 55-56 (1995)