1995 年度実績報告書

音声入力による公文書作成支援装置の開発

研究課題

研究課題/領域番号	07558042
研究種目	試験研究(B)
研究機関	東北大学
研究代表者	牧野正三東北大学, 大型計算機センター, 教授 (00089806)
研究分担者	二矢田勝行松下技研(株)ヒューマンインターフェイス研究所, 所長木幡稔東北大学, 大学院・工学研究科, 助教授 (30186720)
キーワード	連続音声認識 / 識別学習 / 音素認識 / 言語モデル
研究概要	本年度は,「音声入力による公文書作成支援装置」の音響処理部の開発に重点を置いて研究を行った.本研究では,神経回路網の一つである識別学習に基づく音素認識法を開発した.従来の識別学習法では,固定長パターンを対象として研究が行われてきたが,音素認識に適用する場合は,可変長パターンに対して識別学習を適用する必要がある.そのためには,(1)複数パターンの平均化法,(2)パターンのクラスタリング法,(3)パターンの修正法,の3つの問題を解決する必要がある.パターン間の距離尺度としてはDP距離尺度を用いた.複数パターンの平均化法としては,長さの近いもの同士の平均化を繰返して単一のパターンとする方法と,平均的な長さのパターンに統合して行く方法の2方法を提案し比較した.パターンのクラスタリング法としては,各音素独立に行う方法と,音素相互間の分布を考慮して行う方法を提案し比較した.パターンの修正法としては.我々が提案した修正LVQ2法を用いた.音素認識実験によって比較した結果,複数パターンの平均化法としては,平均的長さのパターンに統合して行く方法がよく,クラスタリングの方法としては音素相互間の分布を考慮した方法がよいことがわかった.また標準パターンは前後30ms程度を付加して作成した方がよいことも明らかになった.その結果,固定長パターンでは,78.8%であった音素認識率が80.2%へと向上した.さらに,この標準パターンを用いて連続音声をセグメンテーションに認識する方法を提案した.2段DPマッチングを連接確立と持続時間長の確率を考慮できるように拡張した.認識率68.1%,付加率12.5%,脱落率4.2%という値が得られた.

研究成果
(6件)

すべてその他

すべて文献書誌 (6件)

[文献書誌] 古賀,牧野,城戸: "ローカルピークによる単母音認識に及ぼす時間窓とリフタの影響" 日本音響学会誌. 51. 130-132 (1995)
[文献書誌] 伊藤,牧野: "拡張RHA法による連続音声認識のための単語予備選択" 電子情報通信学会論文誌D-II. J-78-D-II. 400-408 (1995)
[文献書誌] M.SUZUKI,S.MAKINO,H.ASO,H.SHIMODAIRA: "A New HMnet Construction Algorithm Requining No Contextual Factors" IEICE Traus, INF. & SYST.E-78-D. 662-668 (1995)
[文献書誌] 鈴木,牧野,阿曽: "離散型HMnetの言語モデルへの適用" 電子情報通信学会技術研究報告. SP95-33. 65-72 (1995)
[文献書誌] 沖本,牧野,曽根: "確率尺度によるDPマッチングを用いた音素のセグメンテーション" 日本音響学会講演論文集. I. 165-166 (1995)
[文献書誌] 大坂,牧野,曽根: "予備認識結果に基づく持続時間予測の音素認識における効果" 日本音響学会講演論文集. I. 55-56 (1995)

1995 年度 実績報告書

音声入力による公文書作成支援装置の開発

研究代表者

牧野 正三 東北大学, 大型計算機センター, 教授 (00089806)

研究成果

[文献書誌] 古賀,牧野,城戸: "ローカルピークによる単母音認識に及ぼす時間窓とリフタの影響" 日本音響学会誌. 51. 130-132 (1995)

[文献書誌] 伊藤,牧野: "拡張RHA法による連続音声認識のための単語予備選択" 電子情報通信学会論文誌D-II. J-78-D-II. 400-408 (1995)

[文献書誌] M.SUZUKI,S.MAKINO,H.ASO,H.SHIMODAIRA: "A New HMnet Construction Algorithm Requining No Contextual Factors" IEICE Traus, INF. & SYST.E-78-D. 662-668 (1995)

[文献書誌] 鈴木,牧野,阿曽: "離散型HMnetの言語モデルへの適用" 電子情報通信学会技術研究報告. SP95-33. 65-72 (1995)

[文献書誌] 沖本,牧野,曽根: "確率尺度によるDPマッチングを用いた音素のセグメンテーション" 日本音響学会講演論文集. I. 165-166 (1995)

[文献書誌] 大坂,牧野,曽根: "予備認識結果に基づく持続時間予測の音素認識における効果" 日本音響学会講演論文集. I. 55-56 (1995)

1995 年度実績報告書

牧野正三東北大学, 大型計算機センター, 教授 (00089806)