本研究では音声対話システムにおいて、対話コーパスなどの用例を利用して単語や概念を獲得する方法に関する基礎研究を行なった。具体的には、1)対象とする音声対話システムの基本要素の開発、2)対話データの収録とデータベース化および3)対話事例ベースによる自由発話解析手法の提案を行ない、知識獲得に必要な要素を明らかにした。 音声対話システムの基本要素に関しては、用例からの類推のような不確実な知識も扱えるような、確率推論を用いた発話解析手法を提案した。確率推論の方法としては、計算量などを考慮してベイジアンネットワークを用いた。 対話データの収録に関しては、今年度新たに30対話(10人分×3タスク)の対話を収録し、書き起こしを行なった。これらのデータに対して、発話タイプ・意図の情報は付与したが、品詞などを人手で付与するのは大変なので、現在自動タグ付けツールを開発中である。このツールが完成すれば、本研究における用例として十分な量のデータになると思われる。 対話事例ベースによる自由発話解析手法では、新たな事例の単位を提案し、その解析結果を知識として獲得する方法を示した。具体的には、従来手法では事例として文を単位として考えるものが大半であったが、我々は対話システムに適用することを考え、対象としている文とその前の発話に関する情報とで事例の単位とした。この枠組の中で、発話内容の推定および未知語の解析方法のアルゴリズムを提案した。 結論として、本研究では発話解析手法の開発・用例の収集と並行して、用例を利用した解析手法を提案し、解析結果をシステムの知識として獲得する方法を示した。しかし、新たな知識の追加などによって、獲得した知識が間違いであったと分かった場合に、知識の見直しをする必要がある。これは新しい知識を信念として扱い、一定回数以上使われた信念を知識として格上げするなどの工夫が必要となろう。
|