研究概要 |
本研究では伊高次推論の伴う視覚情報理を捉えるため,線画からの立体復元に焦点を当て研究を進めてきた.線画からの3次元復問題は不良設定であり,事前知識なしには解決不可能である.対象世界を多画体世界と仮定すれば,重力に束縛された環境では水平方向や鉛直方向は安定性や強度という点で特別な意味を持ち,物体の稜線や面の方向は自ずと水平や鉛直などに偏るとともに直角の出現頻度が高くなる.人間は経験的知識に基づき,領域や線分にこれらの幾何学的な特性を無意識に割り当て,線画からの立体復元の不良設定性を克服しているものと考えられる. この過程は,水平,鉛直,あるいは直交などの特徴的な幾何属性や関係を仮説集合とし,与えられた線画を説明できる矛盾な仮設の割当を探索する説推論とみなせる.このとき,間違った仮説により不当な制約条件が与えられていればどこかに不整合が生じるはずであり、この不整合の度合を定量的な評価関数とみなせば,無矛盾な仮説の割り当てを一種の正則化として定式化できる. この定式化の利点は仮説割り当てと形状復元が同時に表現されており,並列性を持つ点である.これは,益何属性の予測と形状の想起には目主従関係がないこと,並びに画像の解釈が逐次的ではなく全体的に行われることを意味し,我々の直感と一致する.さらに,工学的な利点として,緩和型の神経回路網により並列処理が期待できること,雑音が許容できること,仮説の追加が容易であることなどが挙げられる. 提案した枠組みに従い,いくつかの異なる仮説集合でそれぞれ様々な線画に対して形状復元実験を試みたところ,いずれの場合も評価関数の適当な調節により正しい割当と直感に一致する復元形状が得られ,手法の基本的な有効性が実証された.さらに,今年度は従来の表の復元に加えて画像に現われない隠れ部分の形状予測についても検討を加えた.
|