研究課題/領域番号 |
22500519
|
研究機関 | 金城大学 |
研究代表者 |
川邊 弘之 金城大学, 社会福祉学部, 教授 (60249167)
|
キーワード | 健康・福祉工学 / 聴覚障害 / 聴講支援 / 音声認識 / 並列処理 |
研究概要 |
我々は、聴覚障害者のために「聴覚障害学生のための聴講システムの研究」に着手している。このシステムの特徴は、音声認識に対して「質より量」のアプローチを適用していることである。日本語音声入力システムの認識率は決して高いわけではない。だが、低い認識率の音声認識エンジンであってでも、種々の音声認識エンジンを数多く同時並列実行し、認識結果に対して多数決を行うことで、少々の誤認識は隠蔽され、結果的に高い認識率が得られる。 【1】種々の特徴を持った音声認識エンジンの定義 音声認識システムは認識エンジンと認識エンジンの調節パラメータとから構成される。同一の音声を異なったパラメータで調整された認識エンジンに与えると、異なった認識結果を得る。我々は複数の認識結果に対して、単語単位で多数決処理して最終結果を決めることになるので、どの単語であってでもどれかの音声認識エンジンが正しい認識結果を与えなければならない。さらに、多数決原理で最終結果を決めることを考慮すると、複数の音声認識エンジンが正しい認識結果を与える必要がある。この方針で、音声認識エンジンに与える調整パラメータの有効範囲を調べ、パラメータを変えることで種々の特徴を持った音声認識エンジンを定義した。 【2】音声認識エンジン群の同時並列実行 上で定義された異なった認識アルゴリズムとパラメータを持つ音声認識エンジン群を申請した1台のワークステーション同時に並列実行した。同時実行数の変化に対する負荷や計算時間、要求される計算機資源などの変化を調べた。また、音声認識エンジンに与えるパラメータを調整し、良好な応答性を与え、妥当な計算量に収まるようにした。 相応の音声認識結果の向上を見たが、さらに劇的に向上させるためには、パラメータ群の再調整が必要である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
「種々の特徴を持った音声認識エンジンの定義」を行うことができ、認識結果に多数決原理を適用することで、音声認識結果の向上を見た。また、ワークステーションによる音声認識の負荷実験を行うことで、「音声認識エンジン群の同時並列実行」が可能であることを実証した。 この結果は研究計画で想定していた程度の達成度である。
|
今後の研究の推進方策 |
本研究では、音声認識エンジンの振舞いを規定するパラメータ群の多様性が重要な役割を演ずる。このパラメータ群が最終的な音声認識結果の向上具合を左右する。問題はどの程度向上するかである。これまでの結果に加え、さらに10から20程度のパラメータ群を定め、パラメータの再調整を行う。 また、英語文と異なり、日本文での単語分割の困難さが問題を複雑にしている。本研究では、音声認識システム群から出力された日本語文字列データに対して、頻度解析や係り受け解析、特徴分析などを行い、多数決原理を用いて原文復元を試みる。
|