研究課題
我々は、聴覚障害者のために「聴覚障害学生のための聴講システムの研究」に着手している。このシステムの特徴は、音声認識に対して「質より量」のアプローチを適用していることである。日本語音声入力システムの認識率は決して高いわけではない。だが、低い認識率の音声認識エンジンであってでも、種々の音声認識エンジンを数多く同時並列実行し、認識結果に対して多数決を行うことで、少々の誤認識は隠蔽され、結果的に高い認識率が得られる。【1】種々の特徴を持った音声認識エンジンの定義音声認識システムは認識エンジンと認識エンジンの調節パラメータとから構成される。同一の音声を異なったパラメータで調整された認識エンジンに与えると、異なった認識結果を得る。我々は複数の認識結果に対して、単語単位で多数決処理して最終結果を決めることになるので、どの単語であってでもどれかの音声認識エンジンが正しい認識結果を与えなければならない。さらに、多数決原理で最終結果を決めることを考慮すると、複数の音声認識エンジンが正しい認識結果を与える必要がある。この方針で、音声認識エンジンに与える調整パラメータの有効範囲を調べ、パラメータを変えることで種々の特徴を持った音声認識エンジンを定義した。【2】多数の低信頼性日本語文字列からの文章の復元英語文と異なり、日本文での単語分割の困難さが問題を複雑にしている。本研究では、複数の音声認識システム群から出力された日本語文字列データに対して、空白を入れつつ単語毎に整列を行い、多数決原理を用いて原文復元を試みた。結果として、良好な復元率であった。
24年度が最終年度であるため、記入しない。
すべて 2013 2012 その他
すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (3件)
Proceedings of 13th Asia Pacific Industrial Engineering & Management Systems Conference, APIEMS 2012
巻: 1 ページ: 1272-1276