• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2015 年度 実施状況報告書

辞書の類似性に着目した圧縮率ベース特徴空間の最適な構築方法の探求

研究課題

研究課題/領域番号 15K00148
研究機関電気通信大学

研究代表者

古賀 久志  電気通信大学, 情報システム学研究科, 准教授 (40361836)

研究期間 (年度) 2015-04-01 – 2018-03-31
キーワード圧縮特徴空間 / 軸の独立性 / 集合間類似検索
研究実績の概要

今年度は、圧縮ベースパターン認識の精度を向上させるために、どのような圧縮特徴空間を作ればよいかという研究課題に取り組んだ。圧縮特徴空間は次元を定める圧縮辞書によって定義される。そこでいくつか辞書の選択方法を実装して評価したが、従来手法を決定的に上回る精度は得られなかった。その一方で、従来手法が選択した辞書群を、独立性を高めるべく修正してパターン認識性能を向上させることに成功した。具体的には、2つの辞書が同一単語を共有する場合、片方の辞書から当該単語を削除して、任意の2辞書が共通単語を持たないことを保証した。提案手法を画像分類に適用した結果、パターン認識の正答率が約5%上昇した。辞書間で共通単語を削除するというアイデアは単純である。しかし、圧縮ベースパターン認識は、2オブジェクトA,B間の類似性をAから抽出した辞書でBを圧縮した時の圧縮率で測るという思想で始まった技術なので、単語レベルで辞書修正するアプローチは試みられておらず、この点が本研究の新しさである。
さらに、圧縮特徴空間の軸の独立性を高めるには、類似しない辞書(すなわち、単語集合)を軸として選ぶ必要があるという考えの下、集合の類似検索について研究した。集合に対してはMin-Hashと呼ばれるハッシュベース類似検索手法が知られている。しかし、このアルゴリズムでは要素数が大きく異なる集合間では類似性判定が困難になるという問題があった。本研究では、集合を分割してハッシュに登録することにより、集合の要素数の違いに影響されずに類似性判定ができることを理論的に示した。本研究成果は国内学会で発表した。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

メインテーマである圧縮率特徴空間の構築方法に関しては、空間軸を構成する辞書間で共通単語を削除するという実現容易な手段により、パターン認識性能を改善できることが示せた。また、辞書間の相関性判定の基盤となる集合間類似検索技術に関して、既存手法とは類似度定義が異なり、ハッシュベースで高速かつ実用性が高い手法を提案できている。

今後の研究の推進方策

現状では、与えられた圧縮率特徴空間を構成する辞書群を修正することによりパターン認識性能を改善している。次は、修正前の辞書群をそもそもどう選択するのかという課題に取り組む。
さらに、今後は圧縮ベースパターン認識に適したアプリケーションを発見して、その上で実験評価を実施することを試みる。今年度は画像分類に提案手法を適用したが、画像処理分野では様々な専用手法が既に存在しており、提案手法のアドバンテージは限定的である。圧縮ベースパターン認識は汎用手法であり、有効な特徴量が未知である新アプリケーションに対して最も効果を発揮する。よって、そのようなアプリケーションの探求は本研究の価値を高める非常に重要なステップとなる。

次年度使用額が生じた理由

国際会議での成果発表を1件予定していたが、研究進捗が予定より数か月遅れたため、平成28年3月までに成果発表に至らなかった。

次年度使用額の使用計画

現在、上記1件の成果はアメリカでの国際会議に投稿中で査読を受けている状況である。これが採録された場合には、次年度使用額を旅費、学会登録費として使用する。

  • 研究成果

    (1件)

すべて 2016

すべて 学会発表 (1件)

  • [学会発表] 共通要素数を重視したハッシュベース集合間類似検索2016

    • 著者名/発表者名
      板橋 大樹,古賀 久志,Gibran Fuentes Pineda GIBRAN,戸田 貴久
    • 学会等名
      第8回データ工学と情報マネジメントに関するフォーラム(DEIM2016)
    • 発表場所
      ヒルトン福岡シーホーク
    • 年月日
      2016-03-02

URL: 

公開日: 2017-01-06  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi