研究概要 |
本研究の,音声入力による公文書作成支援装置は,公認会計士による監査報告書,医師による裁判所への解剖所見報告書,司法書士や不動産鑑定士による種々の報告書や公文書,等を音声で発声した文書を認識対象とする。これらの公文書は,一般に全体報告と個々の部分報告から構成されており,部分報告では,各部分ごとに使用される名詞や動詞の種類が限定される。公文書中に現れる語彙数は約3000〜5000語であるが,文法は比較的固定的なものである。本研究では,解剖所見文書を対象に語彙数3000語の音声入力による公文書作成支援装置を開発した。 本研究では,次の3項目について研究を行った。(1)音響類似性に基づく隠れマルコフ網を用いた高精度音素認識に関する研究,(2)識別学習に基づく高精度音素認識に関する研究,(3)音声による定型文書入力システムに関する研究 (1),(2)では,高精度音素認識システムについての研究を行った。(3)では,解剖所見報告書に代表される定型文書を音声で入力するシステムについて述べている。まず,文書の構造を表すために,ECGI法によってオートマトンを構築し,さらに出現が予測される単語への対応を強化するために,オートマトンの状態同士の距離を定義し,それに基づいてオートマトンを修正して一般化する方法を開発した。認識システムの音素認識部には,二矢田が開発したモデル音声法を用いた。以上の方法を組み合わせて解剖所見の音声入力システムを作成した。システムは,ほぼ実時間で音声を認識することができるが,認識精度は十分なものとは言えず,今後も改善を続ける。
|