2010 Fiscal Year Annual Research Report
画像・音響信号およびテキストデータの融合利用による異種メディア横断検索
Project/Area Number |
21300030
|
Research Institution | Hokkaido University |
Principal Investigator |
長谷山 美紀 北海道大学, 大学院・情報科学研究科, 教授 (00218463)
|
Co-Investigator(Kenkyū-buntansha) |
小川 貴弘 北海道大学, 大学院・情報科学研究科, 助教 (20524028)
荒木 健治 北海道大学, 大学院・情報科学研究科, 教授 (50202742)
|
Keywords | 映像データ処理 / 映像検索 / メタデータ付与 / メディア横断 / 個人嗜好 / 音楽信号処理 / 映像意味理解 / テキスト処理 |
Research Abstract |
映像検索は、一般に映像データに付与されたメタデータを指標として行われる。高精度なセマンティックメタデータを付与できたとしても、その検索の方式は、キーワードの提示を要求する検索形態に限定され、ユーザの曖昧な要求に応えることはできない。これは、画像や映像、さらには、音楽などのメディアが、固有に保持する性質であり、WWWにおけるテキスト検索にみられる、テキストメディアの性質とは大きく異なる。更に増え続けるディジタルコンテンツを前にして、ユーザが望むコンテンツにいかにして効果的に辿り着くかを考える時、ユーザの曖昧な要求に応える検索環境の実現は必須であり、マルチメディアコンテンツに固有の検索理論の構築が望まれる。本研究では、理論構築に必要な一手法である、ユーザが映像や画像、音楽などをクエリとして与えた場合に望む映像や画像、音楽を推定し、効果的に提示可能なメディア横断型検索手法を提案する。本手法により、多様なメディアのコンテンツの視聴履歴から、個人の嗜好を抽出し、異種メディア間での検索を可能とすることで曖昧なユーザの検索要求に応えるための1技術が実現される。異種メディアを横断する検索手法は、提案されておらず、独創的かつ先駆的研究アプローチといえる。 このような研究目的の下、前年度定義した異種メディアコンテンツの距離尺度を用いて、「個人の嗜好を表現可能なモデルの実現」のための研究を進めた。 メディア数と分析対象となるコンテンツ数から正準相関分析を行い得られた相関行列を用いることで、ユーザが保持するコンテンツの全体に対して、各々の相違度を算出し、相関行列を算出する際に、ユーザの視聴履歴による重みを導入することで、映像の好みを表現した。既知の特徴から得られた相関行列により、ユーザにとって未知のコンテンツに対して、特徴量を推定する手法を実現した。
|