2005 Fiscal Year Annual Research Report
意味空間への情報マッピングに基づくクロスメディア検索に関する研究
Project/Area Number |
17300036
|
Research Institution | The University of Tokushima |
Principal Investigator |
北 研二 徳島大学, 高度情報化基盤センター, 教授 (10243734)
|
Co-Investigator(Kenkyū-buntansha) |
黒岩 眞吾 徳島大学, 工学部, 助教授 (20333510)
獅々堀 正幹 徳島大学, 工学部, 助教授 (50274262)
柘植 覚 徳島大学, 工学部, 講師 (00325250)
|
Keywords | 情報検索 / マルチメディア / クロスメディア / 情報システム / 機械学習 |
Research Abstract |
1.高精度なクロスメディア検索モデルの開発 マルチメディア・コンテンツの特徴量(たとえば、画像の色やテクスチャ等に関する特徴量)とコンテンツに付与された言語的なメタ情報との間の相関関係を正準相関分析に基づき学習することにより、メタ情報の付与されていない未知コンテンツに対する意味を推定するモデルに関し研究開発を行った。また、このモデルの高精度化として、サポートベクターマシン等で用いられているカーネル特徴空間上で特徴量とメタ情報との相関を推定するカーネル正準相関分析に関し検討した。 2.言語・画像メディア間のクロスメディア検索 上記で研究した正準相関分析に基づくクロスメディア検索モデルを用いて、与えられたキーワードからそのキーワードに関連した画像を検索する言語・画像メディア間のクロスメディア検索システムを試作した。評価実験では、Corel画像データベースから抽出したカラー写真画像1000枚を用い、特徴量としてはLUV色特徴量を用いた。学習データに対する精度はきわめて高いが、未知データに対しては十分な精度が得られなかったため、今後、カーネル特徴空間上でのモデルを用いた手法で評価を行う。 3.言語・映像メディア間のクロスメディア検索 映像内の字幕(テロップ)を解析することで、与えられた検索質問キーワードが出現する映像シーンを高精度かつ高速に検索する手法について研究開発を進めた。開発した手法では、検索キーワードに含まれている文字が映像内のどの字幕に存在しているかを字幕内の文字画像特徴量と検索キーワードに対応する文字画像特徴量との距離計算に基づいて決定する。文字画像特徴量は多次元ベクトルで表現されるため、高速な検索を行うために各字幕画像特徴量を多次元索引化することで、検索キーワードの文字画像特徴量との距離を近傍検索し、検索キーワードが出現する映像シーンを高速に検索するシステムを開発した。
|
Research Products
(6 results)