研究課題/領域番号 |
15K00148
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
研究分野 |
マルチメディア・データベース
|
研究機関 | 電気通信大学 |
研究代表者 |
古賀 久志 電気通信大学, 大学院情報理工学研究科, 准教授 (40361836)
|
研究期間 (年度) |
2015-04-01 – 2019-03-31
|
研究課題ステータス |
完了 (2018年度)
|
配分額 *注記 |
2,730千円 (直接経費: 2,100千円、間接経費: 630千円)
2017年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2016年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2015年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
|
キーワード | 圧縮ベースパターン認識 / 圧縮辞書 / トライ / 特徴空間 / データ圧縮 / 時系列データ / 辞書間距離 / 圧縮性特徴 / 集合間類似度 / 圧縮特徴空間 / 再圧縮率 / パターン認識 / 軸の独立性 / 集合間類似検索 |
研究成果の概要 |
圧縮ベースパターン認識は分析対象に対する事前知識なしに、データ分析を実現する非教示データ分析技術である。その基本は、データ間の類似性を圧縮率から測定することである。とくに本研究では、SVMやk-meansなど既存パターン認識技術を活用するため、データを圧縮率を並べたベクトルとして表現する圧縮率特徴空間を考え、その適切な空間の構築法をテーマとした。そして、特徴空間の軸を定義する圧縮辞書の単語を入れ替えて、軸間の独立性を高めることにより既存手法よりもパターン認識精度を7~8%向上することに成功した。
|
研究成果の学術的意義や社会的意義 |
近年、人工知能が大流行しているが、学習データを用意する手間が大きいのが課題である。とくにIoTの時代となり、これまで分析対象とされなかった新種のデータを分析する必要に迫られているが、そのようなデータはそもそも性質が不明なので学習データを用意するのが難しい。圧縮ベースパターン認識は非教示でデータ分析をする技術であり、上記のような性質が不明なデータを分析するのが得意であり、学習データを構築するための要素技術として重要である。本研究はそのパターン認識やクラスタリング(データ分類)の精度改善に貢献した。
|