昨年度の研究で、文書における単語の出現頻度から多次元尺度構成法を利用して空間を構成し、その空間に文書、単語を同時布置すると、類似した内容の文書は近く、内容に関連が無い場合は遠くに布置されるような空間を得ることができるということが明らかとなった。また、この空間に存在する文書や単語を、投入されたキーワードを元に構成された部分空間に射影すると、キーワードに関連した内容の文書や単語が近くに、関連の薄い文書や単語は遠くに布置される、ということも確かめられた。 今年度は、対象をマルチメディアデータに拡張することを試み、様々なマルチメディアデータの中でも静止画、その中の「風景写真」に限定して研究を進めた。自然言語で記述された文書から形態素解析を適用して単語を抜き出す作業は、1次元のビット列をある一定サイズのデータの塊(一文字に対応)として捉え、その塊が幾つか並んだもの(単語に対応)として切り分けることである。一方画像データからの特徴抽出は、意味的に2次元の広がりを持つデータであること、ビット列の塊(画素に対応)として捉えられるものが情報抽出の単位としては小さすぎることなど、大きく様相が異なる。 本研究では、各画素の色情報を元に類似した色の出現比率、類似した色を持つ2次元領域の抽出、画像の天地を仮定した上での領域の種類の推定、画像中の領域の存在比率から視点と対象との距離の推定、領域の境界線が直交する頻度から人工物の多寡の推定、などを行なった。抽出されたこれらの特徴を利用した、既定のキーワードによる画像の検索では、誤検索は存在するものの、十分満足できる結果を得ることができた。また、動画像から切り出した風景画像に関しても、同様の手法で検索が行なえる。
|