研究分担者 |
二矢田 勝行 松下技研(株), 情報ネットワーク研究所, 研究職
陳 国躍 東北大学, 大型計算機センター, 助手 (20282014)
木幡 稔 東北大学, 工学研究科, 助教授 (30186720)
工藤 純一 東北大学, 大型計算機センター, 助教授 (40186408)
|
研究概要 |
本年度は,「音声入力による公文書作成支援装置」の音素認識部の性能向上,離散型HMnetによる文節オートマトンの自動作成,解剖所見の読み上げ音声の収録を重点的に行った.音素認識システムの性能向上策として,我々が開発したコンテキスト非依存逐次状態分割法を基にした音素認識システムに話者適応を導入した.その結果,10文章を事前に発声してもらうことにより,話者適応を導入する前に比べ約20%認識率が向上した.また,我々の提案した方法の方が事前に発声を必要とする文章数も少なくてよいことがわかった.さらに,コンテキスト非依存逐次状態分割法を一般化し,離散分布や準連続分布,連続分布にも適用できることを示した.剖見所見書等の日本語文書では,文節が処理の単位となる.従来は,文節の構造をオートマトンで表してきたが,オートマトンの作成には専門家が長時間従事する必要があった.我々はコンテキスト非依存逐次状態法が離散分布にも適用できることに注目し,文節オートマトンを自動的に作成する方法を提案した.日経新聞5年分から,高頻度の実質語500語,機能語200語から成る文章を25万文抜きだし,それを文節に分割した後,5万文を用いて文節モデルを作成し,他の20万文に適用してその有効性を調査した.その結果,提案した方法が従来の方法に比べて極めて有効なことがわかった.現在,さらに語彙数を増やす努力を続けている.解剖所見書150文書(各文書平均3千字)を対象に,読み上げた音声を収録中である.
|