1996 Fiscal Year Annual Research Report
Project/Area Number |
07558042
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Section | 試験 |
Research Institution | Tohoku University |
Principal Investigator |
牧野 正三 東北大学, 大型計算機センター, 教授 (00089806)
|
Co-Investigator(Kenkyū-buntansha) |
二矢田 勝行 松下技研(株), 情報ネットワーク研究所, 研究職
陳 国躍 東北大学, 大型計算機センター, 助手 (20282014)
木幡 稔 東北大学, 工学研究科, 助教授 (30186720)
工藤 純一 東北大学, 大型計算機センター, 助教授 (40186408)
|
Keywords | 連続音声認識 / HMnet / 文節オートマトン / 解剖所見 |
Research Abstract |
本年度は,「音声入力による公文書作成支援装置」の音素認識部の性能向上,離散型HMnetによる文節オートマトンの自動作成,解剖所見の読み上げ音声の収録を重点的に行った.音素認識システムの性能向上策として,我々が開発したコンテキスト非依存逐次状態分割法を基にした音素認識システムに話者適応を導入した.その結果,10文章を事前に発声してもらうことにより,話者適応を導入する前に比べ約20%認識率が向上した.また,我々の提案した方法の方が事前に発声を必要とする文章数も少なくてよいことがわかった.さらに,コンテキスト非依存逐次状態分割法を一般化し,離散分布や準連続分布,連続分布にも適用できることを示した.剖見所見書等の日本語文書では,文節が処理の単位となる.従来は,文節の構造をオートマトンで表してきたが,オートマトンの作成には専門家が長時間従事する必要があった.我々はコンテキスト非依存逐次状態法が離散分布にも適用できることに注目し,文節オートマトンを自動的に作成する方法を提案した.日経新聞5年分から,高頻度の実質語500語,機能語200語から成る文章を25万文抜きだし,それを文節に分割した後,5万文を用いて文節モデルを作成し,他の20万文に適用してその有効性を調査した.その結果,提案した方法が従来の方法に比べて極めて有効なことがわかった.現在,さらに語彙数を増やす努力を続けている.解剖所見書150文書(各文書平均3千字)を対象に,読み上げた音声を収録中である.
|
-
[Publications] 鈴木,阿曽,牧野: "SSS-freeに基づくHMnetを用いた不特定話者音素認識" 日本音響学会講演論文集. 春季号. 143-144 (1996)
-
[Publications] 大坂,牧野: "発声速度に基づく音素持続時間予測を用いた音素認識" 信学技報. Vol. 96 No. 93. 1-6 (1996)
-
[Publications] 沖本,牧野: "可変長パターンと識別学習を用いた音素認識" 信学技報. Vol. 96 No. 93. 7-14 (1996)
-
[Publications] Y. Okimoto, S. Makino: "Phoneme Recognition using reference patterns constructed with discriminative training and DP matching" THE JOURNAL of the Acoustical Society of America. Vol. 100 No. 4. 2757-2757 (1996)
-
[Publications] M. Suzuki, S. Makino: "Acquisition of language models based on HMnet" THE JOURNAL of the Acoustical Society of America. Vol. 100 No. 4. 2791-2791 (1996)
-
[Publications] 牧野 正三: "東北大一松下単語音声データベース" 人文学と情報処理. 第12号. 56-59 (1996)