1996 年度実績報告書

音声入力による公文書作成支援装置の開発

研究課題

研究課題/領域番号	07558042
研究種目	基盤研究(B)
応募区分	試験
研究機関	東北大学
研究代表者	牧野正三東北大学, 大型計算機センター, 教授 (00089806)
研究分担者	二矢田勝行松下技研(株), 情報ネットワーク研究所, 研究職陳国躍東北大学, 大型計算機センター, 助手 (20282014) 木幡稔東北大学, 工学研究科, 助教授 (30186720) 工藤純一東北大学, 大型計算機センター, 助教授 (40186408)
キーワード	連続音声認識 / HMnet / 文節オートマトン / 解剖所見
研究概要	本年度は,「音声入力による公文書作成支援装置」の音素認識部の性能向上,離散型HMnetによる文節オートマトンの自動作成,解剖所見の読み上げ音声の収録を重点的に行った.音素認識システムの性能向上策として,我々が開発したコンテキスト非依存逐次状態分割法を基にした音素認識システムに話者適応を導入した.その結果,10文章を事前に発声してもらうことにより,話者適応を導入する前に比べ約20%認識率が向上した.また,我々の提案した方法の方が事前に発声を必要とする文章数も少なくてよいことがわかった.さらに,コンテキスト非依存逐次状態分割法を一般化し,離散分布や準連続分布,連続分布にも適用できることを示した.剖見所見書等の日本語文書では,文節が処理の単位となる.従来は,文節の構造をオートマトンで表してきたが,オートマトンの作成には専門家が長時間従事する必要があった.我々はコンテキスト非依存逐次状態法が離散分布にも適用できることに注目し,文節オートマトンを自動的に作成する方法を提案した.日経新聞5年分から,高頻度の実質語500語,機能語200語から成る文章を25万文抜きだし,それを文節に分割した後,5万文を用いて文節モデルを作成し,他の20万文に適用してその有効性を調査した.その結果,提案した方法が従来の方法に比べて極めて有効なことがわかった.現在,さらに語彙数を増やす努力を続けている.解剖所見書150文書(各文書平均3千字)を対象に,読み上げた音声を収録中である.

研究成果
(6件)

すべてその他

すべて文献書誌 (6件)

[文献書誌] 鈴木,阿曽,牧野: "SSS-freeに基づくHMnetを用いた不特定話者音素認識" 日本音響学会講演論文集. 春季号. 143-144 (1996)
[文献書誌] 大坂,牧野: "発声速度に基づく音素持続時間予測を用いた音素認識" 信学技報. Vol. 96 No. 93. 1-6 (1996)
[文献書誌] 沖本,牧野: "可変長パターンと識別学習を用いた音素認識" 信学技報. Vol. 96 No. 93. 7-14 (1996)
[文献書誌] Y. Okimoto, S. Makino: "Phoneme Recognition using reference patterns constructed with discriminative training and DP matching" THE JOURNAL of the Acoustical Society of America. Vol. 100 No. 4. 2757-2757 (1996)
[文献書誌] M. Suzuki, S. Makino: "Acquisition of language models based on HMnet" THE JOURNAL of the Acoustical Society of America. Vol. 100 No. 4. 2791-2791 (1996)
[文献書誌] 牧野正三: "東北大一松下単語音声データベース" 人文学と情報処理. 第12号. 56-59 (1996)

1996 年度 実績報告書

音声入力による公文書作成支援装置の開発

研究代表者

牧野 正三 東北大学, 大型計算機センター, 教授 (00089806)

研究成果

[文献書誌] 鈴木,阿曽,牧野: "SSS-freeに基づくHMnetを用いた不特定話者音素認識" 日本音響学会講演論文集. 春季号. 143-144 (1996)

[文献書誌] 大坂,牧野: "発声速度に基づく音素持続時間予測を用いた音素認識" 信学技報. Vol. 96 No. 93. 1-6 (1996)

[文献書誌] 沖本,牧野: "可変長パターンと識別学習を用いた音素認識" 信学技報. Vol. 96 No. 93. 7-14 (1996)

[文献書誌] Y. Okimoto, S. Makino: "Phoneme Recognition using reference patterns constructed with discriminative training and DP matching" THE JOURNAL of the Acoustical Society of America. Vol. 100 No. 4. 2757-2757 (1996)

[文献書誌] M. Suzuki, S. Makino: "Acquisition of language models based on HMnet" THE JOURNAL of the Acoustical Society of America. Vol. 100 No. 4. 2791-2791 (1996)

[文献書誌] 牧野 正三: "東北大一松下単語音声データベース" 人文学と情報処理. 第12号. 56-59 (1996)

1996 年度実績報告書

牧野正三東北大学, 大型計算機センター, 教授 (00089806)

[文献書誌] 牧野正三: "東北大一松下単語音声データベース" 人文学と情報処理. 第12号. 56-59 (1996)