• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2015 Fiscal Year Research-status Report

辞書の類似性に着目した圧縮率ベース特徴空間の最適な構築方法の探求

Research Project

Project/Area Number 15K00148
Research InstitutionThe University of Electro-Communications

Principal Investigator

古賀 久志  電気通信大学, 情報システム学研究科, 准教授 (40361836)

Project Period (FY) 2015-04-01 – 2018-03-31
Keywords圧縮特徴空間 / 軸の独立性 / 集合間類似検索
Outline of Annual Research Achievements

今年度は、圧縮ベースパターン認識の精度を向上させるために、どのような圧縮特徴空間を作ればよいかという研究課題に取り組んだ。圧縮特徴空間は次元を定める圧縮辞書によって定義される。そこでいくつか辞書の選択方法を実装して評価したが、従来手法を決定的に上回る精度は得られなかった。その一方で、従来手法が選択した辞書群を、独立性を高めるべく修正してパターン認識性能を向上させることに成功した。具体的には、2つの辞書が同一単語を共有する場合、片方の辞書から当該単語を削除して、任意の2辞書が共通単語を持たないことを保証した。提案手法を画像分類に適用した結果、パターン認識の正答率が約5%上昇した。辞書間で共通単語を削除するというアイデアは単純である。しかし、圧縮ベースパターン認識は、2オブジェクトA,B間の類似性をAから抽出した辞書でBを圧縮した時の圧縮率で測るという思想で始まった技術なので、単語レベルで辞書修正するアプローチは試みられておらず、この点が本研究の新しさである。
さらに、圧縮特徴空間の軸の独立性を高めるには、類似しない辞書(すなわち、単語集合)を軸として選ぶ必要があるという考えの下、集合の類似検索について研究した。集合に対してはMin-Hashと呼ばれるハッシュベース類似検索手法が知られている。しかし、このアルゴリズムでは要素数が大きく異なる集合間では類似性判定が困難になるという問題があった。本研究では、集合を分割してハッシュに登録することにより、集合の要素数の違いに影響されずに類似性判定ができることを理論的に示した。本研究成果は国内学会で発表した。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

メインテーマである圧縮率特徴空間の構築方法に関しては、空間軸を構成する辞書間で共通単語を削除するという実現容易な手段により、パターン認識性能を改善できることが示せた。また、辞書間の相関性判定の基盤となる集合間類似検索技術に関して、既存手法とは類似度定義が異なり、ハッシュベースで高速かつ実用性が高い手法を提案できている。

Strategy for Future Research Activity

現状では、与えられた圧縮率特徴空間を構成する辞書群を修正することによりパターン認識性能を改善している。次は、修正前の辞書群をそもそもどう選択するのかという課題に取り組む。
さらに、今後は圧縮ベースパターン認識に適したアプリケーションを発見して、その上で実験評価を実施することを試みる。今年度は画像分類に提案手法を適用したが、画像処理分野では様々な専用手法が既に存在しており、提案手法のアドバンテージは限定的である。圧縮ベースパターン認識は汎用手法であり、有効な特徴量が未知である新アプリケーションに対して最も効果を発揮する。よって、そのようなアプリケーションの探求は本研究の価値を高める非常に重要なステップとなる。

Causes of Carryover

国際会議での成果発表を1件予定していたが、研究進捗が予定より数か月遅れたため、平成28年3月までに成果発表に至らなかった。

Expenditure Plan for Carryover Budget

現在、上記1件の成果はアメリカでの国際会議に投稿中で査読を受けている状況である。これが採録された場合には、次年度使用額を旅費、学会登録費として使用する。

  • Research Products

    (1 results)

All 2016

All Presentation (1 results)

  • [Presentation] 共通要素数を重視したハッシュベース集合間類似検索2016

    • Author(s)
      板橋 大樹,古賀 久志,Gibran Fuentes Pineda GIBRAN,戸田 貴久
    • Organizer
      第8回データ工学と情報マネジメントに関するフォーラム(DEIM2016)
    • Place of Presentation
      ヒルトン福岡シーホーク
    • Year and Date
      2016-03-02

URL: 

Published: 2017-01-06  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi