• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2016 年度 実施状況報告書

辞書の類似性に着目した圧縮率ベース特徴空間の最適な構築方法の探求

研究課題

研究課題/領域番号 15K00148
研究機関電気通信大学

研究代表者

古賀 久志  電気通信大学, 大学院情報理工学研究科, 准教授 (40361836)

研究期間 (年度) 2015-04-01 – 2018-03-31
キーワード圧縮特徴空間 / 辞書間距離 / 再圧縮率 / パターン認識
研究実績の概要

今年度は、最初に昨年度に考案した圧縮特徴空間構築アルゴリズムを用いた画像分類実験を実施した。本手法では、圧縮特徴空間の軸を定義する圧縮辞書同士が共通単語を持たないことを保証して軸の独立性を高める。実験の結果、複数の画像データセットに対して提案手法が従来手法より高い分類性能を達成し、提案手法の有効性が確認できた。本成果は査読付き国際会議に採録された。
次に、圧縮ベースパターン認識のさらなる精度向上のため、圧縮時に生成されるデータからの新たな特徴抽出を試みた。既存の圧縮ベースパターン認識技術は(1)圧縮ファイルのサイズから定まる圧縮率を特徴とする手法と(2)辞書に登録される単語集合を特徴とする辞書間距離に大別される。それぞれに対して新特徴を考案した。まず(1)に関しては、圧縮ファイルをもう一度圧縮する時の圧縮率(再圧縮率と呼ぶ)を特徴量とした。圧縮率ではデータ内の単語頻度しか表現できないのに対し、再圧縮率ではどの単語が隣接するのか、つまり単語の並び順まで表現できる。圧縮率と再圧縮率を併用すると、圧縮率のみを利用する既存手法より画像分類性能が約4%改善されることを確認した。次に(2)に関しては、従来手法で無視されていた単語長を辞書間距離の計算に組み込んだ。これは、長い単語はデータ内で大きな割合を占めるため短い単語よりも価値が高いという自然なアイデアに基づく。既存の最先端の辞書間距離であるNMD(Normalized Multiset Distance)を上記のアイデアで改良したWNMD(Weighed NMD)という辞書間距離を設計し、NMDを上回る画像検索精度を達成した。本研究成果は国内学会で発表した。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

メインテーマである圧縮特徴空間の構築に関しては、提案手法の実験評価まで完了し、従来手法を上回る認識精度を達成する手法を確立できた。さらに、今年度は圧縮パターン認識における新しい特徴量を2つ考案し、その結果、世界最先端の認識性能を実現する辞書間距離を開発できた。本辞書間距離では単語長を特徴として使用するが、特徴計算のオーバーヘッドも非常に小さく実用性も十分高い。

今後の研究の推進方策

圧縮ベースパターン認識の利点は汎用性の高さにあり、いかなるデータでも、それが1次元文字列として表現できれば、後はパラメータフリーでパターン認識を実現できる。その観点で提案手法のアプリケーションを増やすことは本研究の価値を高める重要なステップである。これまで画像分類と時系列データ分類に提案手法を適用したが、来年度は音声データに提案手法を適用することを試みたい。
また、圧縮特徴空間の軸を高速に決定するには、類似した辞書が選択されないようにするため辞書(単語集合)間の類似性判定が重要になる。そこで昨年度は集合間の高速類似検索に関して研究したが、今年度は時間的に取り組めなかった。来年度はこの研究テーマを再開する。

次年度使用額が生じた理由

国際会議1件と国内研究会1件の成果発表を予定していたが、それぞれ研究進捗が数ヶ月遅れたため、平成29年3月までに成果発表に至らなかった。

次年度使用額の使用計画

上記2つの研究成果の1つは、既に査読付き国際会議に採択されており、6月にポルトガルで成果発表を実施する。この際、旅費と学会登録費を使用する。また、もう1つの成果も5月に電子情報通信学会コンピュテーション研究会で発表することが決まっており、こちらについても旅費を使用する。

  • 研究成果

    (2件)

すべて 2016

すべて 雑誌論文 (1件) (うち査読あり 1件、 謝辞記載あり 1件) 学会発表 (1件)

  • [雑誌論文] Effective Construction of Compression-based Feature Space2016

    • 著者名/発表者名
      H. Koga, Y. Nakajima and T. Toda
    • 雑誌名

      Proc. International Symposium on Information Theory and Its Applications (ISITA2016)

      巻: - ページ: pp.116-120

    • 査読あり / 謝辞記載あり
  • [学会発表] 圧縮ベースパターン認識に有用な新しい特徴量の抽出2016

    • 著者名/発表者名
      内野太智,古賀久志,戸田貴久
    • 学会等名
      第39回情報理論とその応用シンポジウム(SITA2016)
    • 発表場所
      高山グリーンホテル(岐阜県高山市)
    • 年月日
      2016-12-16

URL: 

公開日: 2018-01-16  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi