研究課題/領域番号 |
10558048
|
研究機関 | 東京大学 |
研究代表者 |
石塚 満 東京大学, 大学院・工学系研究科, 教授 (50114369)
|
研究分担者 |
土肥 浩 東京大学, 大学院・工学系研究科, 助手 (90260504)
伊庭 斉志 東京大学, 大学院・工学系研究科, 助教授 (40302773)
|
キーワード | 擬人化エージェント / マルチモーダルインタフェース / マルチモーダルプレゼンテーション / マークアップ言語 / WWW / 音声駆動WWWブラウザ |
研究概要 |
VSA(Visual Software Agent)は我々が8年程前より開発を行ってきた、自然感の高い動作する顔、音声対話能力を有するマルチモーダル擬人化エージェントシステムである。本研究によりこのVSAをwwwブラウザ(具体的にはNetscape)と結合し、巨大な分散データベースに育っているWWW情報空間の新形態のインタフェースを実現した。Face-to-face型で音声駆動の新しいWWWブラウザを開発したことになる。ブラウザの制御やハイパーリンク先への移動などを音声で指示することができる。ハイパーリンク先を示すアンカ文字列を全て音声認識できる訳ではないので、表示されたWebページをスキャンし、含まれるハイパーリンクを全て抽出して番号付けして提示し、ユーザがこの番号を発話すれば、Webページの移動を可能にする機能を実現している。Netscapeとの結合はプロキシ(代理サーバ)を介して実現した。日常頻繁に擬人化エージェントを通じてアクセスするようなwww上の情報ソース(例えば天気予報など)を定期的にプリフェッチし、ネットワークによる遅延なく情報提供出来るようにするサブ・ソフトウェアエージェント機構も開発した。 キャラクタエージェントを用いるマルチモーダルインタフェースは上記の我々のシステムのように、これまで主として入出力を含むインタラクションの新形態として開発されてきたが、出力系を主とするマルチモーダルプレゼンテーションの用途も重要になってくる。www上の新しい魅力あるマルチモーダル情報コンテンツの流通基盤としても重要となる。このようなキャラクタエージェントを用いるマルチモーダルプレゼンテーションの記述を特定のシステムに依存せず、容易に記述できるようにするためにマークアップ言語MPML(Multimodal Presentation Markup Language)を作成した。MPMLはXML(eXtensible Markup Language)に準拠し、メディア同期機能はSMILに準拠している。MPMLから音声入出力機能を持つキャラクタシステムであるマイクロソフトエージェントを動作させるコンバータを作成し、魅力的なプレゼンテーションが実現できることを実証した。MPMLの仕様はwww上で公開している。
|