研究概要 |
親しみやすく使いやすい計算機システム実現のためには,話し言葉(音声言語)を用いたヒューマンインタフェースが必要不可欠である。人と計算機がなめらかな対話を行うためには,人が文を発話中にシステムが意味の解釈を随時行い,返答やあいづちを行ったり,適切な反応や処理を行うことが望ましい。本研究は,そのような音声言語を発話と同時に理解するマルチモーダルインタフェースの要素技術の確立,およびその実現を目的とし,以下の3項目について研究を実施し、研究成果を得た。 (1)自然言語の漸進的な意味解釈手法: 従来の自然言語処理手法は文単位で意味を求めていたが,本研究では,発話の途中であっても入力文の意味をできる限り解釈する手法を確立した。また,意味情報を用いた音声認識率向上を目指す。 (2)発話同時理解のための連続音声認識技術: 従来の音声認識技術は,1文単位の文法情報や単語の接続確率を用いて認識率の向上させてきたが,本研究では文法情報を用いずに,連続音声から可能なかぎり単語単位で認識を行う技術を確立した。 (3)マルチドメインシステムの統合手法: 各ドメインにおいて独立に構築した音声対話システムを、結合することにより,マルチドメインシステムの実現を可能とするアーキテクチャを提案した。 本研究では,特に(1),(3)について有用な結果を得ることができた。漸進的な意味解釈において,係り受け関係を用いた即時理解手法を開発した。本研究により構築されたプロトタイプシステムSync/Mailはメールの検索や閲覧、発信等を話し言葉とポインティングデバイスにより行うメールツールである。メール処理の最小単位に対応する言語を定め、話し言葉を漸進的に変換することにより、発話と同時にメールの検索を可能にした。このシステムに対する評価実験を行い,漸進的な処理が操作を効率化することを確認した。 また,複数のドメインを対象とする音声対話システムを実現するアーキテクチャを提案した。本アーキテクチャでは,認識された音声が各サブシステムに分配され,評価結果を統合した結果から選択し実行する。これにより,複数のドメインのシステムを,音声により同時に扱うことが可能になる。 (2)については,漸進的な音声認識システムを試作し,Sync/Mailと結合して評価を行い、有効性を確認した。
|