1986 Fiscal Year Annual Research Report
音素認識と話者適応に基づく不特定話者文節音声認識システムの研究開発
Project/Area Number |
61880004
|
Research Institution | Tohoku University |
Principal Investigator |
木村 正行 東北大, 工学部, 教授 (50006219)
|
Co-Investigator(Kenkyū-buntansha) |
安倍 正人 東北大学, 工学部, 助手 (00159443)
高橋 修 富士通(株), 通信企画部複合システム企画部, 部長
江島 俊明 長岡技術科学大学, 助教授 (00124553)
牧野 正三 東北大学, 応用情報学研究センター, 助教授 (00089806)
城戸 健一 東北大学, 応用情報学研究センター, 教授 (30006209)
|
Keywords | 母音認識 / 音素認識 / 単語認識 / 不特定話者 / 話者適応 / 単語の大分類 / 母音間の相対関係 / 部分情報 |
Research Abstract |
音素認識と話者適応を2つの柱として、不特定話者の文節音声認識を実現することを目指して研究を行った。その概要は次の通りである。 (1)計算機システムの整備 本研究を効率よく推進するための計算機システムとして、小型機A-30(富士通製)2台を核とする音声情報処理システムを整備し、これを用いて、音声認識実験、認識アルゴリズムの設計、ソフトウェアの開発などを進めている。 (2)手法【I】と【II】の統合 音素認識手法【I】と話者適応の手法【II】とを相互補間的に統合するためのシステム構成について検討した。その結果、音素認識における付加及び脱落が文節音声認識の大きな障害となることを明確にし、この問題の解決策について検討を進めている。 (3)認識手法の開発 1)単語の大分類 音素認識における付加及び脱落の問題を基本的に解決するための手法として、単語の部分情報を活用し高速かつ高精度で単語音声の大分類を行う手法の開発を行い、有用な手掛りを得た。その成果は近く発表する予定である。 2)単語認識(細分類) 単語の大分類と音素認識を結合し、音素をキーとする単語の構造に関する知識を活用する手法について研究を進めてきた。その結果、音素認識率が70%程度であっても高精度かつ高速の単語認識が実現できる有力な手掛りを得た。 3)話者適応 話者の個人性はより多く母音に反映されることに着目し、高精度で認識される母音を基にして話者適応を行う方法を考案し、その有効性について実験を主する評価を行っている。 4)重回帰分析と相対関係を考慮して、高精度の母音認識を実現できる見透しを得た。 今後、システム全体として有機的統合と音素及び単語の各レベルの認識精度の向上を計る。
|
Research Products
(6 results)
-
[Publications] 兪そう: 電子通信学会論文誌. J69-D. 1320-1327 (1986)
-
[Publications] 下平博: 電子通信学会技術研究報告. 86. 1-6 (1987)
-
[Publications] S.Makino: Speech Communication. 5. 225-237 (1986)
-
[Publications] K.T.Kim: J.Acoust.Soc.Jpn.(E). 7. 325-334 (1986)
-
[Publications] C.K.Kim: J.Acoust.Soc.Jpn.(E). 7. 239-247 (1986)
-
[Publications] S.Moriai: Proc.ICASSP. 2251-2254 (1986)