研究課題/領域番号 |
63460222
|
研究機関 | 東北大学 |
研究代表者 |
牧野 正三 東北大学, 応用情報研究センター, 助教授 (00089806)
|
研究分担者 |
金井 浩 東北大学, 工学部, 助手 (10185895)
阿倍 正人 東北大学, 応用情報研究センター, 助手 (00159443)
城戸 健一 東北大学, 応用情報研究センター, 教授 (30006209)
|
キーワード | 音声認識 / 文字認識 / 言語情報 / 文節オートマン / 構文解析法 |
研究概要 |
昭和63年度中に得られた研究成果は以下のとうりである。(1)文字認識・音声認識両者に共通に利用できる文字認識あるいは音素認識システムのシミュレータを開発した。文字相互間あるいは音素相互間の類似度マトリクスに基づいて文字あるいは音素認識率に対応した誤りを含む文字・音素系列を生成できる。この様な精度の高いシミュレータは初めてである。(2)音素間や単語間、文節間の結合確率や係受けなどの統計資料作成には大量の構文解析された文章が必要である。そのための構文解析システムを作成した。(3)文字間あるいは音素間の結合確率を利用して誤り訂正を行う方法を開発し、1次から2次までの結合確率の有効性をシミュレータを利用して評価した。文字・音素認識率が数パーセント向上した。(4)Blochの活用表に基づく日本語文節構造モデルを構成し、誤りを含む文字列あるいは音素系列に適用する方法を開発し、文字認識率と文節検出率の関係をシミュレータを利用して評価した。更に、文節構造モデルに種々の拘束。付加することによって、誤りにより強くする方法を開発し、それらの拘束の有効性をシミュレータで生成された音素系列で評価した。連続音声中の音素系列に適用したとされる文節候補数は約4分の3に減少した。Blochの活用表に基づく文節構造モデルは初めてのものである。(5)置換・挿入・脱落を含む音素または文字系列から文節を抽出する方法を開発し、更に文節間の係受けを調べて正しい文章を出力する方法を開発した。この方法は従来から用いられている文節数最小法を含んでいる。
|