• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

辞書の類似性に着目した圧縮率ベース特徴空間の最適な構築方法の探求

研究課題

研究課題/領域番号 15K00148
研究種目

基盤研究(C)

配分区分基金
応募区分一般
研究分野 マルチメディア・データベース
研究機関電気通信大学

研究代表者

古賀 久志  電気通信大学, 大学院情報理工学研究科, 准教授 (40361836)

研究期間 (年度) 2015-04-01 – 2019-03-31
研究課題ステータス 完了 (2018年度)
配分額 *注記
2,730千円 (直接経費: 2,100千円、間接経費: 630千円)
2017年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2016年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2015年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
キーワード圧縮ベースパターン認識 / 圧縮辞書 / トライ / 特徴空間 / データ圧縮 / 時系列データ / 辞書間距離 / 圧縮性特徴 / 集合間類似度 / 圧縮特徴空間 / 再圧縮率 / パターン認識 / 軸の独立性 / 集合間類似検索
研究成果の概要

圧縮ベースパターン認識は分析対象に対する事前知識なしに、データ分析を実現する非教示データ分析技術である。その基本は、データ間の類似性を圧縮率から測定することである。とくに本研究では、SVMやk-meansなど既存パターン認識技術を活用するため、データを圧縮率を並べたベクトルとして表現する圧縮率特徴空間を考え、その適切な空間の構築法をテーマとした。そして、特徴空間の軸を定義する圧縮辞書の単語を入れ替えて、軸間の独立性を高めることにより既存手法よりもパターン認識精度を7~8%向上することに成功した。

研究成果の学術的意義や社会的意義

近年、人工知能が大流行しているが、学習データを用意する手間が大きいのが課題である。とくにIoTの時代となり、これまで分析対象とされなかった新種のデータを分析する必要に迫られているが、そのようなデータはそもそも性質が不明なので学習データを用意するのが難しい。圧縮ベースパターン認識は非教示でデータ分析をする技術であり、上記のような性質が不明なデータを分析するのが得意であり、学習データを構築するための要素技術として重要である。本研究はそのパターン認識やクラスタリング(データ分類)の精度改善に貢献した。

報告書

(5件)
  • 2018 実績報告書   研究成果報告書 ( PDF )
  • 2017 実施状況報告書
  • 2016 実施状況報告書
  • 2015 実施状況報告書
  • 研究成果

    (11件)

すべて 2018 2017 2016

すべて 雑誌論文 (6件) (うち査読あり 3件、 謝辞記載あり 1件) 学会発表 (5件)

  • [雑誌論文] ユークリッド距離に基づく多観点非類似度とその分割最適化クラスタリングへの応用2018

    • 著者名/発表者名
      藤原勇二,古賀久志,戸田貴久
    • 雑誌名

      人工知能学会研究資料

      巻: SIG-FPAI-B509 ページ: 51-56

    • NAID

      130008061396

    • 関連する報告書
      2017 実施状況報告書
  • [雑誌論文] 集合間類似度を用いたストリームデータのtop-k類似検索に対する高速な厳密解アルゴリズム2017

    • 著者名/発表者名
      山崎智博,古賀久志,戸田貴久
    • 雑誌名

      信学技報

      巻: 117(28) ページ: 1-8

    • 関連する報告書
      2017 実施状況報告書
  • [雑誌論文] 多観点類似度を用いた凝集型階層クラスタリング2017

    • 著者名/発表者名
      藤原勇二, 古賀久志, 戸田貴久
    • 雑誌名

      情報科学技術フォーラム(FIT2017)

      巻: 第2分冊 ページ: 121-124

    • NAID

      170000184442

    • 関連する報告書
      2017 実施状況報告書
  • [雑誌論文] Fast Exact Algorithm to Solve Continuous Similarity Search for Evolving Queries2017

    • 著者名/発表者名
      T. Yamazaki, H. Koga and T.Toda
    • 雑誌名

      springer LNCS

      巻: 10648 ページ: 84-96

    • DOI

      10.1007/978-3-319-70145-5_7

    • ISBN
      9783319701448, 9783319701455
    • 関連する報告書
      2017 実施状況報告書
    • 査読あり
  • [雑誌論文] Improved Compression-Based Pattern Recognition Exploiting New Useful Features2017

    • 著者名/発表者名
      T. Uchino, H. Koga, T. Toda
    • 雑誌名

      springer LNCS

      巻: 10255 ページ: 363-371

    • DOI

      10.1007/978-3-319-58838-4_40

    • ISBN
      9783319588377, 9783319588384
    • 関連する報告書
      2017 実施状況報告書
    • 査読あり
  • [雑誌論文] Effective Construction of Compression-based Feature Space2016

    • 著者名/発表者名
      H. Koga, Y. Nakajima and T. Toda
    • 雑誌名

      Proc. International Symposium on Information Theory and Its Applications (ISITA2016)

      巻: - ページ: 116-120

    • 関連する報告書
      2016 実施状況報告書
    • 査読あり / 謝辞記載あり
  • [学会発表] 品質パラメータの学習による動画像圧縮技術に基づく時系列分類手法の改良2018

    • 著者名/発表者名
      村井建応,古賀久志,戸田貴久
    • 学会等名
      第39回情報理論とその応用シンポジウム
    • 関連する報告書
      2018 実績報告書
  • [学会発表] 圧縮性基底辞書の単語数均等化による特徴空間の改善2018

    • 著者名/発表者名
      大内晶太,古賀久志
    • 学会等名
      第39回情報理論とその応用シンポジウム
    • 関連する報告書
      2018 実績報告書
  • [学会発表] 共通要素を類似度とするハッシュベース集合間類似検索手法の改善2018

    • 著者名/発表者名
      鈴木 聡,古賀 久志,Gibran FUENTES PINEDA,戸田 貴久
    • 学会等名
      第10回データ工学と情報マネジメントに関するフォーラム(DEIM2018)
    • 関連する報告書
      2017 実施状況報告書
  • [学会発表] 圧縮ベースパターン認識に有用な新しい特徴量の抽出2016

    • 著者名/発表者名
      内野太智,古賀久志,戸田貴久
    • 学会等名
      第39回情報理論とその応用シンポジウム(SITA2016)
    • 発表場所
      高山グリーンホテル(岐阜県高山市)
    • 年月日
      2016-12-16
    • 関連する報告書
      2016 実施状況報告書
  • [学会発表] 共通要素数を重視したハッシュベース集合間類似検索2016

    • 著者名/発表者名
      板橋 大樹,古賀 久志,Gibran Fuentes Pineda GIBRAN,戸田 貴久
    • 学会等名
      第8回データ工学と情報マネジメントに関するフォーラム(DEIM2016)
    • 発表場所
      ヒルトン福岡シーホーク
    • 年月日
      2016-03-02
    • 関連する報告書
      2015 実施状況報告書

URL: 

公開日: 2015-04-16   更新日: 2020-03-30  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi