1996 Fiscal Year Annual Research Report
Project/Area Number |
07557041
|
Section | 試験 |
Research Institution | Fukushima Medical University |
Principal Investigator |
平岩 幸一 福島県立医科大学, 医学部, 教授 (60124616)
|
Co-Investigator(Kenkyū-buntansha) |
二矢田 勝行 松下技研(株), ヒューマンインターフェイス研究所, 所長
牧野 正三 東北大学, 大型計算機センター, 教授 (00089806)
勾坂 馨 東北大学, 医学部, 教授 (70006740)
|
Keywords | 剖検所見 / 入力装置 / 音声入力 / 音素モデル / 文節モデル / HMM / HMnet |
Research Abstract |
本年度は、音素認識システムの性能向上、文節オートマトンの自動作成、剖検所見の読み上げ音声の収録を重点的に行った。音素認識システム性能向上策として、我々が開発したコンテキスト非依存遂次状態分割法を基にした音素認識システムに話者適応を導入した。その結果、10文章を事前に発声してもらうことにより、話者適応を導入する前に比べ約20%認識率が向上した。また、我々の提案した方法の方が事前に発声を必要とする文章数も少なくてよいことがわかった。さらに、コンテキスト非依存遂次状態分割法を一般化し、離散分布や準連続分布、連続分布にも適用できることを示した。剖検所見書等の日本語文書では、文節が処理の単位となる。従来は、文節の構造をオートマトンで表してきたが、オートマトンの作成には専門家が長時間従事する必要があった。我々はコンテキスト非依存遂次序歌分割法が離散分布にも適用できることに注目し、文節オートマンを自動的に作成する方法を提案した。日経新聞5年分から、高頻度の実質語100語、機能語100語から成る文章を8万文抜き出し、それを文節に分割した後、5万文を用いて文節モデルを作成し、他の3万文に適用してその有用性を調査した。その結果、提案した方法が従来の方法に比べて極めて有効なことが分かった。現在、さらに語彙数を増やす努力を続けている。剖検所見書100文書(各文書平均3千字)を対象に、読み上げた音声を収録中である。
|
-
[Publications] 鈴木基之: "SSS-freeに基づくHMnetを用いた不特定話者音素認識" 日本音響学会講演論文集. 春季号. 143-144 (1996)
-
[Publications] 大坂幸弘: "発声速度に基づく音素持続時間予測を用いた音素認識" 信学技報. 96・93. 1-6 (1996)
-
[Publications] 沖本純幸: "可変長パターンと識別学習を用いた音素認識" 信学技報. 96・93. 7-14 (1996)
-
[Publications] 鈴木基之: "種々の出力確率分布を持つHMnet構成法" 日本音響学会講演論文集. 秋季号. 55-56 (1996)
-
[Publications] 阿部俊朗: "SSS-freeに基づくHMnetにおけるVFSの効果" 日本音響学会講演論文集. 秋季号. 125-126 (1996)
-
[Publications] Motoyuki Suzuki: "Acquisition of language models based on HMnet." The Journal of the Acoustical Society of America. 100.4. 2791-2791 (1996)
-
[Publications] Yoshiyuki Okimoto: "Phoneme recognition using reference patterns constructed with discriminative training and DP matching" The Journal of the Acoustical Society of America. 100.4. 2757-2757 (1996)
-
[Publications] 牧野正三: "東北大-松下単語音声データベース" 人文学と情報処理. 12. 56-59 (1996)