研究概要 |
今年度の研究は次の2点に絞って行ってきた。一つはキーワードと画像データからの情報を如何に融合すべきかとの問題である。もう一つは視覚情報管理システムの仮想空間構築への応用である。コンテンツに基づいた視覚情報管理は画像データに依存する特徴を用いて客観的な索引を作成することを目的としていた。しかし、情報検索者はできればキーワードに近い、つまり、セマンテックスが富んだ特徴で検索したいのは実情である。そこで、画像データによる客観的な索引と検索者に必要となるキーワードに近い特徴との間のギャップを如何に埋めるかが大きな問題となる。我々は二つのアプローチを提案した。一つはfeed-forwardのニューラルネットワークを用いて、検索者との対話的な学習を行うことによって、客観的な索引を生成することを試みた。ここで採用したニューラルネットワークは隠れ層が一層だけで、この層にあるノードの数が学習に応じて動的に変化する。もう一つは画像の構造化表現によるアプローチである[1],[2],[3],[4]。どちらのアプローチからも良い実験結果が得られた。ニューラルネットワークによる方法は学習が基本であるため、例題に依存する欠点があると予測されるが、ロバスト性の高い検索が行うことが可能である。構造化表現による方法は構造的パターン認識手法を利用しているため、セマンテックスが明確に分かるメリットがあるが、高い検索精度を要求する場合にはリコールが低くなることがある。また、仮想現実感への応用については出土文物の復元や意匠設計などについで検討し始めた[5],[6]。
|