WWW情報検索サービスのための音声言語インタフェースシステムの開発
Project/Area Number |
11780267
|
Research Category |
Grant-in-Aid for Encouragement of Young Scientists (A)
|
Allocation Type | Single-year Grants |
Research Field |
Intelligent informatics
|
Research Institution | Shizuoka University |
Principal Investigator |
甲斐 充彦 静岡大学, 工学部, 助教授 (60283496)
|
Project Period (FY) |
1999 – 2000
|
Project Status |
Completed (Fiscal Year 2000)
|
Budget Amount *help |
¥1,100,000 (Direct Cost: ¥1,100,000)
Fiscal Year 2000: ¥500,000 (Direct Cost: ¥500,000)
Fiscal Year 1999: ¥600,000 (Direct Cost: ¥600,000)
|
Keywords | 音声認識 / WWW / 情報検索 / タスク記述 / 音声文書検索 / マルチモーダルインタフェース / XML / プロトタイピング / ユーザインタフェース / 音声対話 / 言語モデル |
Research Abstract |
本年度の研究では、WWW上での効率的な情報閲覧・検索のための音声言語インタフェース技術を開発するという当初の目的・計画に関してそれぞれ以下のような成果が得られた。 1.キーワードの検索のための音声認識手法の開発 情報検索システムなどWeb上で利用されるGUIベースのユーザインタフェースには、固有名詞の入力を必要とするものが多く、既存の音声認識システムでは扱いが困難であった。本研究では、日本語において扱いやすい音節を単位とした連続音声認識技術を応用し、音声文書検索および任意のキーワード入力を実現する方法を開発した。具体的には、統計的な言語モデルであるN-gramを日本語の音節列に関して大量のテキストコーパスから求め、音節trigramの制約に基づくone-pass型の連続音声認識アルゴリズムへ適用した。これをもとに、音声文書検索においてはベクトル空間法および複数候補(N-best)の利用に基づく類似性評価法を検討し、音声認識誤りによる性能劣化を抑えた検索法を開発した。また、キーワード入力においては、音節列の複数候補(N-best)とGUIによるユーザ選択に基づく固有名詞入力方式を開発し、実用性への検証を行った。 2.システムの試作とデータ収集環境の開発 音声以外のモダリティを含むマルチモーダルインタフェース(MMI)システムは、一般に複数の複雑なコンポーネントが有機的に結合し動作するように実現されなければならない。従来は専用の高度なシステム開発環境を提供することに重点が置かれているが、本研究では比較的身近なWWW上の情報検索サービスへの適用を想定し、汎用性の高いMMIプラットフォームを開発した。開発したプラットフォームは、WWWブラウザをクライアントとし、システムや対話タスクの記述及び各種コンポーネント間の通信の手順までをすべてXML(eXtensible Markup Language)で統一することにより汎用性を実現した。実際に、従来UNIX OS上で構築されていたMMI対話システムをこのプラットフォーム上に容易に移行でき、ネットワークを介してユーザが利用できる環境を構築した。これにより、広範な対話データ収集のためのユーザ利用環境を容易に提供可能となった。
|
Report
(2 results)
Research Products
(2 results)