WWW情報検索サービスのための音声言語インタフェースシステムの開発

Research Project

Project/Area Number	11780267
Research Category	Grant-in-Aid for Encouragement of Young Scientists (A)
Allocation Type	Single-year Grants
Research Field	Intelligent informatics
Research Institution	Shizuoka University
Principal Investigator	甲斐充彦静岡大学, 工学部, 助教授 (60283496)
Project Period (FY)	1999 – 2000
Project Status	Completed (Fiscal Year 2000)
Budget Amount *help	¥1,100,000 (Direct Cost: ¥1,100,000) Fiscal Year 2000: ¥500,000 (Direct Cost: ¥500,000) Fiscal Year 1999: ¥600,000 (Direct Cost: ¥600,000)
Keywords	音声認識 / WWW / 情報検索 / タスク記述 / 音声文書検索 / マルチモーダルインタフェース / XML / プロトタイピング / ユーザインタフェース / 音声対話 / 言語モデル
Research Abstract	本年度の研究では、WWW上での効率的な情報閲覧・検索のための音声言語インタフェース技術を開発するという当初の目的・計画に関してそれぞれ以下のような成果が得られた。 1.キーワードの検索のための音声認識手法の開発情報検索システムなどWeb上で利用されるGUIベースのユーザインタフェースには、固有名詞の入力を必要とするものが多く、既存の音声認識システムでは扱いが困難であった。本研究では、日本語において扱いやすい音節を単位とした連続音声認識技術を応用し、音声文書検索および任意のキーワード入力を実現する方法を開発した。具体的には、統計的な言語モデルであるN-gramを日本語の音節列に関して大量のテキストコーパスから求め、音節trigramの制約に基づくone-pass型の連続音声認識アルゴリズムへ適用した。これをもとに、音声文書検索においてはベクトル空間法および複数候補(N-best)の利用に基づく類似性評価法を検討し、音声認識誤りによる性能劣化を抑えた検索法を開発した。また、キーワード入力においては、音節列の複数候補(N-best)とGUIによるユーザ選択に基づく固有名詞入力方式を開発し、実用性への検証を行った。 2.システムの試作とデータ収集環境の開発音声以外のモダリティを含むマルチモーダルインタフェース(MMI)システムは、一般に複数の複雑なコンポーネントが有機的に結合し動作するように実現されなければならない。従来は専用の高度なシステム開発環境を提供することに重点が置かれているが、本研究では比較的身近なWWW上の情報検索サービスへの適用を想定し、汎用性の高いMMIプラットフォームを開発した。開発したプラットフォームは、WWWブラウザをクライアントとし、システムや対話タスクの記述及び各種コンポーネント間の通信の手順までをすべてXML(eXtensible Markup Language)で統一することにより汎用性を実現した。実際に、従来UNIX OS上で構築されていたMMI対話システムをこのプラットフォーム上に容易に移行でき、ネットワークを介してユーザが利用できる環境を構築した。これにより、広範な対話データ収集のためのユーザ利用環境を容易に提供可能となった。

Report

(2 results)

2000 Annual Research Report
1999 Annual Research Report

Research Products
(2 results)

All Other

All Publications (2 results)

[Publications] A.Kai,T.Nakano,and S.Nakagawa: "Usability of Browser-Based Pen-Touch/Speech User Interfaces for Form-Based Applications in Mobile Environment"Lecture Notes in Computer Science 1948 : Advances in Multimodal Interfaces-ICMI2000, Springer. Vol.1948. 549-556 (2000)
- Related Report
  2000 Annual Research Report
[Publications] A.Kai,T.Nakano and S.Nakagawa: "A speech Interface ststem for information on retrieval tasks on the www"Proceedings of International Workshop Speech and Cpmputer. 141-144 (1999)
- Related Report
  1999 Annual Research Report

WWW情報検索サービスのための音声言語インタフェースシステムの開発

Principal Investigator

甲斐 充彦 静岡大学, 工学部, 助教授 (60283496)

¥1,100,000 (Direct Cost: ¥1,100,000)

Report

Research Products

[Publications] A.Kai,T.Nakano,and S.Nakagawa: "Usability of Browser-Based Pen-Touch/Speech User Interfaces for Form-Based Applications in Mobile Environment"Lecture Notes in Computer Science 1948 : Advances in Multimodal Interfaces-ICMI2000, Springer. Vol.1948. 549-556 (2000)

Related Report

[Publications] A.Kai,T.Nakano and S.Nakagawa: "A speech Interface ststem for information on retrieval tasks on the www"Proceedings of International Workshop Speech and Cpmputer. 141-144 (1999)

Related Report

甲斐充彦静岡大学, 工学部, 助教授 (60283496)