研究課題/領域番号 |
19500175
|
研究機関 | 岩手県立大学 |
研究代表者 |
戴 瑩 岩手県立大学, ソフトウェア情報学部, 准教授 (60305290)
|
研究分担者 |
蔡 大維 公立大学法人岩手県立大学, ソフトウェア情報学部, 准教授 (30281041)
CHAKRABORTY Basabi 公立大学法人岩手県立大学, ソフトウェア情報学部, 准教授 (90305293)
|
キーワード | 画像・ビデオ / 意味データ構造 / 検索 / あいまいと多様性 / 連想値 / 分散ユーザ / 自動注釈 / 分散環境 |
研究概要 |
1) 本研究は画像・ビデオの意味のあいまいさと人間がそれに対する解釈の多義さをうまく反映できるために、画像・ビデオの意味はあらかじめに設定したdomain/categoryとの連想値によるデータ構造で表現すると提案した。さらに、lexicon's paradigmatic relationを参考する上で、各category間の関係を表明できるsemantic tolerance relation modelを構築し、その相互関係を数値化する方法を考案した。 2) 人間の画像・ビデオに対する解釈の多義さにより、新たにdomainやクラスを追加、削除する要求が生じると考える。そのために、domainやクラスの追加、削除に伴う分類器の再構築を効率的に実現できる手法を考察し、少量の学習サンプルでクラスを代表するモデルを構築する方法を検討し、有効性を検証した。 3) ビデオをshotに分割し、そして、shotを代表するkey-frameを抽出する。その上で、image/key-frameの意味を表現する有効手法として、あらかじめに設定したdomain/categoryとの連想値によりimage/key-frameを自動的に登録する実現方法を検討した。実験結果はsemantic tolerance relation modelの導入がcategoryに対する連想値の計算精度の向上に役に立ったことを示した。 4) 上述の成果を基づいて、分散ユーザによる分散環境をベースした大規模画像・ビデオの意味自動登録と検索システム構築の仕組みを検討し、そのplatformを開発した。さらに、上述データ構造で得た画像・ビデオの意味metadataは画像の意味のあいまいさと解釈の多義さをうまく反映できることを5人の被験者のcross-domain/category queryによる画像・ビデオの検索結果により検証した。そのうち、5人の被験者のtarget画像における検出率の平均は82%であり、その有効性を示した。
|