美しい,上品である,清潔感があるなど,人物画像の見た目から感じる印象について,人間の様に画像を見て感じる深層学習モデルを新たに開発する.既存の学習モデルでは,人物画像と印象単語のペアを訓練サンプルとするデータドリブンの手法を適用することが一般的であり,システムが人間と同じ様に見て感じているとは言えなかった.本研究の目的は,人物印象の自動推定を対象とし,人間が情報システムへ教師ラベルを与える作業を通して,人間の視覚特性を計測し,その特性をアルゴリズムに組み込む方法を構築していくことにある.まず,人物印象に対する視覚特性を,ラベル付け作業時に高精細で計測する方法を探っていく.次に,深層学習のアテンション機構を発展させ,印象に対する視覚特性を組み込んだネットワークモデルを設計していく. 本年度は,昨年度に引き続き,人物画像の印象を人間が見分ける時の視覚特性を計測し,その視覚特性を確率分布で表現する手法を構築した.昨年度は手や頭など身体上の意味のある部位において視線の確率分布を求めていたが,本年度はその考え方を発展させ,部位ごとではなく体表面そのものにおいて視線の確率分布を求める手法を構築した.具体的には,刺激として与えられた画像中の被写体を観察者が見た時,その観察者の視線が被写体のどこに集まるかを,三次元標準人体モデルを用いて可視化する手法を提案した.提案手法では,視線分布を表すヒートマップを,体型と姿勢とが予め決定された標準人体モデルの表面へ重ね合わせた.実験結果より,ヒートマップを人体モデルに重ね合わせる我々の可視化では,ヒートマップを二次元画像に重ね合わせる既存の可視化と比べて,観察者の視線分布を,分析者は容易に比較できることを確認した.研究成果の進捗について本年度は国際学会2件と国内学会1件とを発表し,本課題の着眼点,および,主観評価による実験結果について高評価を得た.
|