1991 Fiscal Year Annual Research Report
人間の音声言語認識過程に立脚した大文脈連続音声認識方式
Project/Area Number |
03452164
|
Research Institution | Tokyo University of Science |
Principal Investigator |
藤崎 博也 東京理科大学, 基礎工学部, 教授 (80010776)
|
Co-Investigator(Kenkyū-buntansha) |
伊藤 紘二 東京理科大学, 基礎工学部, 教授 (20013683)
原田 哲也 東京理科大学, 基礎工学部, 講師 (80189703)
広瀬 啓吉 東京大学, 工学部, 助教授 (50111472)
|
Keywords | 音声言語 / 認識過程 / 大文脈 / 連続音声 / 音声認識方式 / 人間 / 内部辞書 / 辞書検索 |
Research Abstract |
現在の音声認識研究の多くは、人間の音声言語認識過程を全く参考とせず、認識単一を音素・音節等の画一的なものに限定しており、また認識の処理範囲が極めて狭く、大きな文脈を利用していないため、人間に匹敵しうるような性能に達していない。本研究では、人間の音声言語認識過程を実験的に検討し、その知見にもとづいて人間の処理過程をモデルにより表現し、さらにこれを利用した音声言語自動認識方式を構築することを目的としたものであるが、初年度にあたる平成3年度の実績は下記の通りである。 1.人間の音声言語認識過程の実験的検討 種々の加工を施した自然音声を刺激として知覚実験を行った結果,次の知見が得られた. (1)音声知覚の単位は単音・音節から句・文まで条件により変化する。 (2)大きな単位ほど少ない情報量で、より速やかに知覚される。 (3)同じ大きさの単位を知覚する場合にも必要な情報量は条件により異なる。 (4)内部辞書検索の速度・精度は、音響・統語・意味・談話等の要因により、また短期的・長期的出現頻度により、動的に変化する。 2.人間の音声言語認識過程のモデル化 上記の知見にもとづき、人間の音声言語認識過程のモデルを構築した。 3.上記のモデル化にもとづく音声認識方式の提案と実験的検証 複数の時間的単位・特徴表現の精度を併用する音声認識方式を提案しその有効性を音素および単語認識実験により検証した。 4.連続音声認識における大文脈情報利用方法の検討 文以上の大きな文脈に含まれる情報を音声言語認識に有効に利用するための方法に関して検討を行っている。
|
-
[Publications] 藤崎 博也: "音声認識における音響的特徴表現の時間単位に関する検討" 日本音響学会平成3年秋季研究発表会講演論文集. 1. 153-154 (1991)
-
[Publications] 峯松 信明: "複数の時間単位・精度の音響的特徴表現を用いた音声認識" 日本音響学会平成4年春季研究発表会講演論文集. 1. 31-32 (1992)
-
[Publications] 大野 澄雄: "連続音声の語句の照合における種々のレベルの辞書情報の利用" 日本音響学会平成4年春季研究発表会講演論文集. 1. 95-96 (1992)
-
[Publications] Fujisaki,H.: "A method for automatic speech recognition based on findings of the human process of speech perception" Proceedings of the 1992 International Conference on Spoken Language Processing (Banff,Canada). (1992)