2016 Fiscal Year Research-status Report
辞書の類似性に着目した圧縮率ベース特徴空間の最適な構築方法の探求
Project/Area Number |
15K00148
|
Research Institution | The University of Electro-Communications |
Principal Investigator |
古賀 久志 電気通信大学, 大学院情報理工学研究科, 准教授 (40361836)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | 圧縮特徴空間 / 辞書間距離 / 再圧縮率 / パターン認識 |
Outline of Annual Research Achievements |
今年度は、最初に昨年度に考案した圧縮特徴空間構築アルゴリズムを用いた画像分類実験を実施した。本手法では、圧縮特徴空間の軸を定義する圧縮辞書同士が共通単語を持たないことを保証して軸の独立性を高める。実験の結果、複数の画像データセットに対して提案手法が従来手法より高い分類性能を達成し、提案手法の有効性が確認できた。本成果は査読付き国際会議に採録された。 次に、圧縮ベースパターン認識のさらなる精度向上のため、圧縮時に生成されるデータからの新たな特徴抽出を試みた。既存の圧縮ベースパターン認識技術は(1)圧縮ファイルのサイズから定まる圧縮率を特徴とする手法と(2)辞書に登録される単語集合を特徴とする辞書間距離に大別される。それぞれに対して新特徴を考案した。まず(1)に関しては、圧縮ファイルをもう一度圧縮する時の圧縮率(再圧縮率と呼ぶ)を特徴量とした。圧縮率ではデータ内の単語頻度しか表現できないのに対し、再圧縮率ではどの単語が隣接するのか、つまり単語の並び順まで表現できる。圧縮率と再圧縮率を併用すると、圧縮率のみを利用する既存手法より画像分類性能が約4%改善されることを確認した。次に(2)に関しては、従来手法で無視されていた単語長を辞書間距離の計算に組み込んだ。これは、長い単語はデータ内で大きな割合を占めるため短い単語よりも価値が高いという自然なアイデアに基づく。既存の最先端の辞書間距離であるNMD(Normalized Multiset Distance)を上記のアイデアで改良したWNMD(Weighed NMD)という辞書間距離を設計し、NMDを上回る画像検索精度を達成した。本研究成果は国内学会で発表した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
メインテーマである圧縮特徴空間の構築に関しては、提案手法の実験評価まで完了し、従来手法を上回る認識精度を達成する手法を確立できた。さらに、今年度は圧縮パターン認識における新しい特徴量を2つ考案し、その結果、世界最先端の認識性能を実現する辞書間距離を開発できた。本辞書間距離では単語長を特徴として使用するが、特徴計算のオーバーヘッドも非常に小さく実用性も十分高い。
|
Strategy for Future Research Activity |
圧縮ベースパターン認識の利点は汎用性の高さにあり、いかなるデータでも、それが1次元文字列として表現できれば、後はパラメータフリーでパターン認識を実現できる。その観点で提案手法のアプリケーションを増やすことは本研究の価値を高める重要なステップである。これまで画像分類と時系列データ分類に提案手法を適用したが、来年度は音声データに提案手法を適用することを試みたい。 また、圧縮特徴空間の軸を高速に決定するには、類似した辞書が選択されないようにするため辞書(単語集合)間の類似性判定が重要になる。そこで昨年度は集合間の高速類似検索に関して研究したが、今年度は時間的に取り組めなかった。来年度はこの研究テーマを再開する。
|
Causes of Carryover |
国際会議1件と国内研究会1件の成果発表を予定していたが、それぞれ研究進捗が数ヶ月遅れたため、平成29年3月までに成果発表に至らなかった。
|
Expenditure Plan for Carryover Budget |
上記2つの研究成果の1つは、既に査読付き国際会議に採択されており、6月にポルトガルで成果発表を実施する。この際、旅費と学会登録費を使用する。また、もう1つの成果も5月に電子情報通信学会コンピュテーション研究会で発表することが決まっており、こちらについても旅費を使用する。
|
Research Products
(2 results)