WWW情報検索サービスのための音声言語インタフェースシステムの開発

研究課題

研究課題/領域番号	11780267
研究種目	奨励研究(A)
配分区分	補助金
研究分野	知能情報学
研究機関	静岡大学
研究代表者	甲斐充彦静岡大学, 工学部, 助教授 (60283496)
研究期間 (年度)	1999 – 2000
研究課題ステータス	完了 (2000年度)
配分額 *注記	1,100千円 (直接経費: 1,100千円) 2000年度: 500千円 (直接経費: 500千円) 1999年度: 600千円 (直接経費: 600千円)
キーワード	音声認識 / WWW / 情報検索 / タスク記述 / 音声文書検索 / マルチモーダルインタフェース / XML / プロトタイピング / ユーザインタフェース / 音声対話 / 言語モデル
研究概要	本年度の研究では、WWW上での効率的な情報閲覧・検索のための音声言語インタフェース技術を開発するという当初の目的・計画に関してそれぞれ以下のような成果が得られた。 1.キーワードの検索のための音声認識手法の開発情報検索システムなどWeb上で利用されるGUIベースのユーザインタフェースには、固有名詞の入力を必要とするものが多く、既存の音声認識システムでは扱いが困難であった。本研究では、日本語において扱いやすい音節を単位とした連続音声認識技術を応用し、音声文書検索および任意のキーワード入力を実現する方法を開発した。具体的には、統計的な言語モデルであるN-gramを日本語の音節列に関して大量のテキストコーパスから求め、音節trigramの制約に基づくone-pass型の連続音声認識アルゴリズムへ適用した。これをもとに、音声文書検索においてはベクトル空間法および複数候補(N-best)の利用に基づく類似性評価法を検討し、音声認識誤りによる性能劣化を抑えた検索法を開発した。また、キーワード入力においては、音節列の複数候補(N-best)とGUIによるユーザ選択に基づく固有名詞入力方式を開発し、実用性への検証を行った。 2.システムの試作とデータ収集環境の開発音声以外のモダリティを含むマルチモーダルインタフェース(MMI)システムは、一般に複数の複雑なコンポーネントが有機的に結合し動作するように実現されなければならない。従来は専用の高度なシステム開発環境を提供することに重点が置かれているが、本研究では比較的身近なWWW上の情報検索サービスへの適用を想定し、汎用性の高いMMIプラットフォームを開発した。開発したプラットフォームは、WWWブラウザをクライアントとし、システムや対話タスクの記述及び各種コンポーネント間の通信の手順までをすべてXML(eXtensible Markup Language)で統一することにより汎用性を実現した。実際に、従来UNIX OS上で構築されていたMMI対話システムをこのプラットフォーム上に容易に移行でき、ネットワークを介してユーザが利用できる環境を構築した。これにより、広範な対話データ収集のためのユーザ利用環境を容易に提供可能となった。

報告書

(2件)

2000 実績報告書
1999 実績報告書

研究成果
(2件)

すべてその他

すべて文献書誌 (2件)

[文献書誌] A.Kai,T.Nakano,and S.Nakagawa: "Usability of Browser-Based Pen-Touch/Speech User Interfaces for Form-Based Applications in Mobile Environment"Lecture Notes in Computer Science 1948 : Advances in Multimodal Interfaces-ICMI2000, Springer. Vol.1948. 549-556 (2000)
- 関連する報告書
  2000 実績報告書
[文献書誌] A.Kai,T.Nakano and S.Nakagawa: "A speech Interface ststem for information on retrieval tasks on the www"Proceedings of International Workshop Speech and Cpmputer. 141-144 (1999)
- 関連する報告書
  1999 実績報告書

WWW情報検索サービスのための音声言語インタフェースシステムの開発

研究代表者

甲斐 充彦 静岡大学, 工学部, 助教授 (60283496)

1,100千円 (直接経費: 1,100千円)

報告書

研究成果

[文献書誌] A.Kai,T.Nakano,and S.Nakagawa: "Usability of Browser-Based Pen-Touch/Speech User Interfaces for Form-Based Applications in Mobile Environment"Lecture Notes in Computer Science 1948 : Advances in Multimodal Interfaces-ICMI2000, Springer. Vol.1948. 549-556 (2000)

関連する報告書

[文献書誌] A.Kai,T.Nakano and S.Nakagawa: "A speech Interface ststem for information on retrieval tasks on the www"Proceedings of International Workshop Speech and Cpmputer. 141-144 (1999)

関連する報告書

甲斐充彦静岡大学, 工学部, 助教授 (60283496)