研究課題/領域番号 |
13558033
|
研究機関 | 豊橋技術科学大学 |
研究代表者 |
中川 聖一 豊橋技術科学大学, 工学部, 教授 (20115893)
|
研究分担者 |
甲斐 充彦 静岡大学, 工学部, 助教授 (60283496)
北岡 教英 豊橋技術科学大学, 工学部, 助手 (10333501)
小林 聡 豊橋技術科学大学, 工学部, 助手 (90314096)
中野 崇 シーエーアイ(株), 技術部・リーダ
伊藤 敏彦 静岡大学, 工学部, 助教授 (20313926)
|
キーワード | 音声入力 / 音声認識 / フォーム入力 / ホームページ / 携帯情報端末 / 姓名入力 |
研究概要 |
今年度は、フォーム型Web情報サービス享受のために、以下の3点について研究を行った。 (1)高精度音声認識システムの開発 HMMに基づく大語彙連続音声認識システムでは、語彙数の増加に伴い認識時間が増加する。全ての語彙のHMMの状態を展開すると、状態数は語彙サイズに対しほぼ線形に増加する。ツリー型辞書を用いたデコーディングアルゴリズムには、1本の静的な木を用いて最尤の直前単語からビタビ経路を計算する方法(l-best近似)などがある。しかし、バイグラムを用いてサーチを行う場合は、l-best近似では最適解は保証されない。そこで、本研究ではl-best近似を用いた音声認識システムにおいて、バイグラム確率を用いて選択したいくつかの単語のHMMの状態を線形に展開し厳密にOne-pass計算を行う手法を提案し、評価した。各時刻において250程度の単語を厳密計算し、またコンテキスト依存モデルによる音響リスコアリングを行うことによって、認識性能が向上した。 (2)名前の入力 フォーム型入力には、単語辞書の存在しない文字列を入力する必要のある場合がある。代表的な例として、名前の入力がある。本研究では、名前の音声入力に対して、音節列を5候補出力する方法と各入力音節に対して5候補出力する方法を検討した。前者の方法で姓が63%、後者の方法で97%が正しく入力できることがわかった。この両手法を取り入れた音声入力インタフェースを構築した。 (3)携帯情報端末からのフォーム入力の評価 フォーム入力型音声入力インターフェースを携帯情報端末に移植し、小画面の特殊さに対処するため画面の表示領域を分割するようにした後、評価実験を行い、音声によるフォーム入力の有効性を明らかにした。
|