Research Abstract |
情報システムの多機能化、高機能化によってもたらされる複雑性を克服し,安心・快適な情報環境を構築するには,人間と情報システムとの間のギャップを,ロボットによるマルチモーダル・インタラクションによって解消する事が必要である.本研究では,人間とロボットが,実世界の中で臨機応変に意味レベルのインタラクションを達成することを目指して,人間の振る舞いや周囲環境の様子を認識・理解しつつ,その情報をライフログやサイバースペース等から得られる膨大な知識情報と統合・解釈し,状況に即した対話や知的支援などを行う機能の構築を目的とした. H22年度は成果の統合とシステム化に重点を置いた.前年度までに,実世界事象,特に人間の行為からの意味情報抽出の各要素,すわなち,動作認識,事物認識,記号を経由した蓄積情報との関連づけ等に関して大きな進展があった.これらを統合することで,自然言語やロボット動作を通して人間と意味的インタラクションを行うシステムの構築に取り組んだ.研究計画中の課題としては,次の2課題に対応する.課題5:意味情報抽出,蓄積情報との統合解釈,意味レベル行動生成を融合,一体化した意味レベル相互作用の理論とシステム,課題6:意味レベル相互作用を知的人間支援行動として具現化するロボットシステムや言語インタラクション. 最終的な統合システムは「ジャーナリストロボット」として実現した.これは,日常環境中を自律的に動き回り,人々の興味を喚起する出来事を発見,認識,理解し,インタビューなども行って,ニュースブログのような分かり易い形にまとめて情報発信するという,従来にない新たな知的支援機能を世界で初めて提案し実現したものである.画像音声認識,自律移動,人間の発見・接近・発話に基づくインタビュー機能,などを統合実装し,その上に,意味レベルインタラクション機能として,実世界を自律的に探索し,重要な意味を持つ異変を画像認識と知識情報を統合して認識・解釈し,インタビューも自律的に行い,それらの結果を自然言語処理と統合してニュース記事として生成,配信するシステムを構築した. このシステムは,最終成果報告会でデモを行い,メディア報道を含め多くの関心を集めた.また,画像認識等の要素技術は,権威ある国際会議のコンペ世界3位他,多くの世界トップレベル国際会議論文採択や受賞等で高く評価された.
|