2009 Fiscal Year Annual Research Report
圧縮空間を用いたマルチメディアデータマイニングとそのウェブマイニングへの応用
Project/Area Number |
19500076
|
Research Institution | The University of Electro-Communications |
Principal Investigator |
渡邊 俊典 The University of Electro-Communications, 大学院・情報システム学研究科, 教授 (10242348)
|
Co-Investigator(Kenkyū-buntansha) |
古賀 久志 電気通信大学, 大学院・情報システム学研究科, 准教授 (40361836)
張 諾 電気通信大学, 大学院・情報システム学研究科, 助教 (20436736)
横山 貴紀 電気通信大学, 大学院・情報システム学研究科, 助教 (10401621)
|
Keywords | データ圧縮 / テキスト分類 / 画像分類 |
Research Abstract |
本年度はテキスト圧縮法を利用して,独立な圧縮率ベクトル空間を構成する方法を検討した.この圧縮率ベクトル空間構成法に基づいて,文書を自動的に分類する方法と画像を分類する方法を検討した.通常,テキスト分類を行うために自然言語処理の手法が,従来手法に利用されている.テキスト圧縮法を利用して独立な圧縮率ベクトル空間を構成することにより,自然言語処理を行わない半面,文書の特徴と文書間の関係を正確に表現できる.大規模の実際の文書に適用し,実験を行って,提案手法の有効性を確認した.テキスト分類において,提案手法で構成した独立圧縮率ベクトル空間による実験結果を従来の代表的な手法と比較して検証実験を行った.提案手法は従来法より正確にテキストを分類することが,文書の特徴を正しく表現でき,文書分類に適していることが検証できた. 次に,本手法をテクスチャ画像の分類に適用し,自動的に画像を分類する方法を検証した.この手法ではテクスチャ画像をテキスト化して,画像を代表する圧縮率ベクトルに基づいて分類する.文字列の圧縮性に着目した,テクスチャ画像の重複特徴の表現が正確にできる.実画像を用いた実験によって,通常の画像とそれをある角度回転した画像が併存する場合,精度が高い分類結果が得られた. また,本研究の原理としている圧縮性に基づくデータ分類法に関し,最近EUに加入したRomania政府機関(Rosa:宇宙局)主催のGEOSSワークショップに招待され,講演発表を行った.
|
Research Products
(5 results)