研究課題
本研究の目的は、シーンコンテキストスケール(Scene-Context Scale)と呼ばれる新しいシーン内の文脈情報(Scene Context)を提案し、その文脈情報に基づいて大規模の画像データベースから画像分類及び画像検索を実現することであった。平成23年度には、ランダムフォレスト(Random Forests)を用いて、画像ごとにスケール最適化されたテクストンを求めた。ランダムフォレストをマルチスケール(Multi-scale)に拡張し、そこから画像ごとに正しいシーンコンテキストスケールを推定することでスケール最適化されたテクストンの抽出が高速にできた。平成24年度には、求めた画像の特徴量からローカル特徴量とグローバル特徴量に分け、その特徴量を上手く統合するために新しいマルチカーネル学習(Multiple kernel learning)手法を提案した。異なるスケール空間から抽出された画像のローカル特徴量とグローバル特徴量をより効果的に統合するため、新しいマルチカーネルのモデルを構築した。提案されたマルチカーネル学習手法は、画像分類及び画像のセグメンテーションに適用し、実験でその評価を行った。3年目になる平成25年度には、提案したシーン内の新しい文脈情報と学習方法を実際の画像データベースに適用し、画像分類の実験を行いその評価を発表した。画像データベースはチャレンジングな大規模のデータベース、The PASCAL Visual Object Classes Challenge 2007を利用した。さらに、開発したフレームワークをロボットの物体認識研究技術に適用し、空間コンテキスト情報に基づいて物体認識を行った。3年間開発した技術は、取りまとめ国内と海外の会議や著名な学術誌に投稿し、成果の発表を行った。
すべて 2014 その他
すべて 雑誌論文 (2件) (うち査読あり 2件) 学会発表 (4件)
IT Convergence Practice
巻: Vol.2,No.1 ページ: 2-14
http://isyou.info/inpra/papers/inpra-v2n1-01.pdf
International Journal of Engineering and Technology
巻: Vol.6,No.2 ページ: 128-131
http://www.ijetch.org/papers/680-W00043.pdf