研究概要 |
本年度の次の2点に重点を置いて研究した. 1,対話制御方式の数学的モデル-現在の音声認識技術では、認識の誤りを完全になくすることは不可能である。そこで、本年度は、ユーザの1つの発話に含まれている重要な単語(これを情報項目と呼ぶ)毎に、その信頼度を定量的に評価し、信頼度の高い情報項目のみを受理し、信頼性の低い項目は、再入力を促したり、確認質問をして精度を向上させる対話制御方式の性能を数学的に解析した。すなわち、音声認識システムの性能として、ある発話中に含まれている1個の情報項目を受理する確率αと受理された情報項目が正しく認識されていた確率pを与え、上述のような対話制御方式をとる音声対話システムの全体としての性能を次の2つの値、すなわち、(1)n個の情報項目を含む1つの発話を最終的に受理するまでに、ユーザとシステムとの間で交わされた平均発話数N(n)と(2)何回かのやり取りの後受理された発話の内容が正しくシステムに伝達される確率P(n)、で評価する。本年度の研究ではN(n)、P(n)とα、pとの間の定量的な関係を導いた。(新美) 2,音声対話の収集と情報伝達の効率化-インターネット上のデータベース検索をタスクとする音声対話システムを想定して、模擬対話実験を行い、多量の対話を収集した。対話を書き起こし、ユーザの発話の中に現れる単語とインターネット画面との関係を解析した。その結果、ユーザの発話に含まれる単語は画面の操作に関するものと画面の印象を述べるものとに大別されることが分かった。(西本、小林)
|