研究概要 |
本研究は,自由発話文の認識のために新しい枠組の開発を目指したものであり,その方針として「連想関係」を中心にすえた.本研究は次の3つの段階から成る. 1.大規模な言語データベースを解析し,その中に表れる連想関係やその他の言語情報を調査する. 2.連想情報を用いて効率の良い認識のできるアルゴリズムを開発する. 3.これらの結果を用いて,実際に稼働する実験システムを試作する. 本年度の研究成果として,これらの段階のうち,(1)言語データベースの解析と,各種言語現象の調査,(2)連想関係を用いて認識を行うアルゴリズム「拡張RHA法」の開発の2つを行った.以下にその概略を述べる. 1.言語データベースの解析: 分析に用いたデータベースは,日本音響学会研究用連続音声データベースの模擬対話テキストデータベースに含まれる書き起こしテキストである.この中の44対話(3633発話,19019文節)を分析対象とした.まず,このテキストに対して形態素解析を行ない,実質語3386個,機能語615個を抽出した.次に,この分析結果から,対話音声のための文節モデルを構築した.このモデルは,従来我々が文章朗読音声認識のために用いてきた文節モデルを拡張したものである.この文節モデルを用いて,データベース内の単語間の遷移確率,perplexity等を求めている. 認識アルゴリズム「拡張RHA法」の開発: 連想関係を用いて連続音声中から単語認識を行なうアルゴリズム「拡張RHA法」を開発した.この認識法は,各種の情報を用いて単語を連想し認識するというものであり,従来のパターンマッチング的手法とは異なる.今回は,連想情報源として認識された音素のみを用い,従来的な連続音声認識の単語予備選択法として用い,その有効性を検証した.全く同じ枠組で,例えば単語の連続関係等の情報を有効に用いた音声認識が可能である.
|