2010 Fiscal Year Annual Research Report
聴覚障害学生のための聴講支援システム-「質より量」のアプローチによる音声認識-
Project/Area Number |
22500519
|
Research Institution | Kinjo University |
Principal Investigator |
川邊 弘之 金城大学, 社会福祉学部, 教授 (60249167)
|
Keywords | 健康・福祉工学 / 聴覚障害 / 聴講支援 / 音声認識 / 並列処理 |
Research Abstract |
我々は、聴覚障害者のために「聴覚障害学生のための聴講システムの研究」に着手している。このシステムの特徴は、音声認識に対して「質より量」のアプローチを適用していることである。日本語音声入力システムの認識率は決して高いわけではない。だが、低い認識率の音声認識エンジンであってでも、種々の音声認識エンジンを数多く同時並列実行し、認識結果に対して多数決を行うことで、少々の誤認識は隠蔽され、結果的に高い認識率が得られる。 【1】音声認識エンジン群の同時並列実行 認識アルゴリズムとパラメータが共通な複数のJuliusをノートPCとワークステーションでそれぞれ同時に並列実行する実験を行った。各CPUコアに1つの音声認識エンジンが割り当てられている間は,音声認識のための実行時間の上昇が低く抑えられ、十分に短い実行時間であった。それ以上の規模の並列実行を行うと,1つのCPUコアを2つまたは3つのプログラムが共同で利用することになるので,実行時間の増える割合が上がってしまい、コンピュータの応答が悪くなった。また、Juliusのメモリ消費量は,音声認識プログラム1つあたり,約120MBであった。メモリに対す負荷はそれほどではない。以上のことから,我々のノートテイクシステムを実現するには,現在のノートPCはメモリ搭載量では十分だが演算能力では非力で,ワークステーションはメモリ搭載量・演算能力ともに十分だと,結論した。 【2】種々の特徴を持った音声認識エンジンの定義 音声認識システムは認識エンジンと調節パラメータとから構成される。同一の音声を異なったパラメータで調整された認識エンジンに与えると、異なった認識結果を得る。我々は複数の認識結果に対して、多数決処理して最終結果を決めるので、多様な結果を与えるようパラメータを調整する必要がある。これは現在も継続して行っている。
|