研究概要 |
音声は人間にとって最も自然で,かつ確実なコミュニケーションの手段である.また,近年の音声認識技術の進歩により不特定話者の連続音声認識技術も格段に進歩している.一方,データベースは組織体のかけがえのない共有情報資源であり,社会の情報化の進展と共にその意義はますます増大している.しかしながら,データベースへのアクセスは相変わらずキーボードから入力する文字ベースのインタフェースに依っているのが現状である.この様な状況は携帯電話や携帯情報端末の普及によるユ-ビキタスな社会環境とも馴染まないものになってきている.そこで,本研究ではマルチモーダルなオフィス・作業環境の実現,遠隔地からのデータベースアクセスの実現,あるいは移動体環境からのデータベースアクセスを実現する目的で,音声によるリレーショナルデータベースのアクセスを理論的・実践的に研究した.まず,Sunワークステーション上で稼働するリレーショナルデータベースシステムOracle7への音声によるデータベースアクセスシステムを可能とすべく,不特定話者の音声音声認識装置,オ-ジス総研のDS200,それに明電舎の音声合成装置FINETALKを基盤として,4つのソフトウエアモジュールを開発することで,プロトタイプシステムを構築し,システムを評価した.その結果,同音語問題をどう解決するか,不完全な日本語文による問い合わせをどう取り扱うか,などの問題点が明かとなった.本研究では,とくに同音語問題を取り上げ,その問題解決に取り組んだ.そのために,従来のキ-概念を包含するインスタンスキーなる新しいキ-概念を導入しそれにより同音語問題を解決できることを示し,我々のアプローチの正当性を示した.今後さらに研究を充実させることにより実用性の高いシステムが開発できるであろうことを示した.
|