本研究目的は,高次レベルの画像特徴から元画像を再構成することにある.本研究で対象としたのは,長い間画像特徴のデファクトスタンダードであったBag-of-Visual-Word特徴(BoVW)である.この画像特徴からの画像再構成問題を,ビジュアルワードの最適配置問題と,これからの画像生成の二つの問題に分割して取り組んだ.特に,前者のビジュアルワードの最適配置問題を,ビジュアルワードの統計的特性を考慮したジグソーパズル問題として捉えることで新規手法を提案した. 本研究で得られた知見をまとめると以下のようになる.1)画像再構成実験では,提案手法を用いることで,BoVWから本来の画像を再構成できることが分かった.2)また,ビジュアルワードの元の配置を推定するには,ビジュアルワード間の接続性の自然さと,ビジュアルワードの大域的位置の存在可能性の双方を考慮することが有効であることが分かった.3)コーディング段階で生じる量子化誤差は,画像パッチを生成する際にはさほど問題にならないが,ビジュアルワードの幾何学的情報の推定には大きな影響を与えることが分かった.4)最適化手法として,遺伝的アルゴリズムと山登り法を組み合わせた新規手法を提案し,この最適化手法を用いることで元画像を再構成することが可能であることが分かった.しかしながら計算コストがかかることから今後計算量の削減が必要である. さらに,本提案手法を様々な新規の応用問題に適用した.一つ目は画像モーフィングであり,画像特徴の組み合わせから新たな画像を生成した.二つ目は画像の線形識別器の重みベクトルを可視化した.三つめは文章からの新規画像生成である.これらの研究は創造性を生み出す機械知能へ展開する予定である.
|