2008 Fiscal Year Annual Research Report
大規模マルチメディアコンテンツからのデータマイニングとその応用
Project/Area Number |
20500140
|
Research Institution | Hiroshima City University |
Principal Investigator |
内田 智之 Hiroshima City University, 情報科学研究科, 准教授 (70264934)
|
Co-Investigator(Kenkyū-buntansha) |
正代 隆義 九州大学, システム情報科学研究院, 准教授 (50226304)
宮原 哲浩 広島市立大学, 情報科学研究科, 准教授 (90209932)
|
Keywords | アルゴリズム / 機械学習 / 情報基礎 / データマイニング / 情報検索システム / グラフ |
Research Abstract |
平成20年度は、マルチメディアコンテンツのグラフ構造を含む特徴を知識として抽出するデータマイニング手法に関する基礎理論の構築を目指し以下の研究を行った。 マルチメディアコンテンツをブラウザ上で表示した際のレイアウト情報は外平面的グラフでモデル化することができる。そこで、研究テーマ「マルチメディアコンテンツに対する知識表現と機械学習アルゴリズムの構築」について、外平面的グラフのある族に対し、新しいグラフ構造パターンであるブロック保存型外平面的グラフパターン(Block-Preserving Outerplanar Graph Pattem,BPOグラフパターンとよぶ)を導入し、BPOグラフパターンが多項式時間機械学習可能であることを示し、さらに頻出するBPOグラフパターンを効率よく抽出する手法を提案した。また、研究テーマ「マルチメディアコンテンツ検索システムのデータ管理手法構築」について、木構造パターンをより簡潔により効率的に保持する手法を提案し、収集したWebページの実データを使った評価実験も行った。また、マルチメディアコンテンツのレイアウトの特徴を表現するグラフパターンとして、Two-Terminal Series Parallel(TTSP)グラフパターンについて検討し、その多項式時間学習可能性を示した。これにより、木構造パターンだけではなく、外平面的グラフパターンやTTSPグラフパターンなども十分マルチメディアコンテンツの特徴を表現する上で有用なものであることが判明した。上記の研究成果に加えて、インターネット上に存在するマルチメディアコンテンツの収集およびTV等をキャプチャーしてのサンプルデータの収集・作成も行った。 以上が、本年度に得た研究成果の概要である。
|
Research Products
(5 results)