「ヒトの視覚系は,多種多様な画像処理アルゴリズムの集合体である」との考え方から,これまでに提案されてきた各種視覚数理モデルや,新たな視覚数理モデルを相互に結合・改良・挿入・共有できるソフトウェア基盤を構築し,実際に新たな学術的知見も得ることを研究目的とする.また,脳による情報処理は視覚情報処理だけではなく,記憶や運動制御など様々な処理を行っているため,構築するソフトウェア基盤はこれら多様性にも対応できる必要がある. 拡張性・持続性ならびにソフトウェア的な国際標準規格に従う基盤を開発するために,RTミドルウェアと呼ばれる規格を採用することとした.また,この規格の一実装であるOpenRTM-aist を基礎として,視覚数理モデル研究に必要なソフトウェアを開発した.RTミドルウェア自体はロボット開発用に構築されたものであるため,特に運動制御モデルとの親和性が高い. 本研究ではまず,視覚数理モデル間のデータフォーマットを策定した.次に視覚数理モデルの構成要素(いわば部品)を提供するために,OpenCVとよばれる画像処理関数ライブラリ中の大量のアルゴリズムや自作の画像処理を,容易にOpenRTM-aist上で実行させるためのシステム:OpenCV-RTCを作成・公開した.同時に,モデル共有データベースなどを含めた全体的なパッケージを HI-brain と名付けて公開した. 本システム上で新たな学術的成果も得ることができた.一例として,視覚的注視位置を予測する数理モデルを開発し,MIT Saliency benchmark において第1位の評価値を得た(2014年8月8日).その他にも,両眼立体視,MT/MST野に関する新たなモデルを得ることもできた. 本システムは,計測自動制御学会システムインテグレーション部会においてロボット工業会賞とベストサポート賞を受賞した.
|