• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2013 年度 実施状況報告書

組合せ最適化問題としてのパターン認識:理論構築と実用化に関する基礎研究

研究課題

研究課題/領域番号 25330200
研究種目

基盤研究(C)

研究機関長崎大学

研究代表者

酒井 智弥  長崎大学, 工学(系)研究科(研究院), 准教授 (30345003)

研究期間 (年度) 2013-04-01 – 2016-03-31
キーワード機械学習 / 信号処理 / 圧縮センシング / 画像 / スパースモデリング
研究概要

複数の基本クラス(subclass)の組合せによって認識対象を説明する「組合せパターン認識」の理論構築のため、パターン認識が帰着する組合せ最適化問題を整理した。組合せの要素となる基本クラスが既知か否か、クラスが階層関係等の何らかの関係構造を持つか否かによって問題をC0~C5の6種類に分類した:(C0) 既知の基本クラス・関係構造無し、(C1) 既知の基本クラス・既知の関係構造有り、(C2) 既知の基本クラス・未知の関係構造有り、(C3) 未知の基本クラス・関係構造無し、(C4) 未知の基本クラス・既知の関係構造有り、(C5) 未知の基本クラス・未知の関係構造有り.単純な例として、顔認識を(C0)の問題として扱うと、個人は既知の基本クラスであり、人数と共に基本クラスは増える。しかし、顔認識を(C3)として扱うこともできる。この場合、顔画像をスパース表現する辞書(ただし辞書ベクトル間に関係はないものとする)を機械学習すると、顔の個人差や陰影、姿勢等の違いによって基本クラスが推定される。この基本クラスの組合せによって個人の顔を表現し分類するので、人数と共に基本クラスを増やすことを避けられる。この利点を活かし、組合せ最適解の有無によってクラスの追加と共に基本クラスを更新する手法を開発中である。一方、組合せパターン認識の実用性を検討するために、様々な文字画像から機械学習した線画とその組合せによる文字検出と認識について取り組んだ。(C5)の問題設定では文字を構成する基本的な線画ではなく偏や旁等が基本クラスとして機械学習された。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

平成25年度は、パターン認識が帰着する組合せ最適化問題の整理および解法の効率化、関連研究の動向調査を行う計画であった。問題整理については研究実績の概要にある通り進捗している。動向調査では、パターン認識に数多く応用されるようになったスパースコーディングを組合せパターン認識の一種と見なすとき、クラスの関係の抽出あるいは既知の関係構造を導入可能な機械学習に大きな研究の余地が残されていることを確認できた。研究成果の発表・発信に若干の遅れが生じているが、文字検出・認識や肺聴診音認識の検証実験を前倒して遂行できている。また、次元圧縮による機械学習の効率化を検討する過程で、高次元非線形写像の機械学習の効率化も見込めることを発見している。

今後の研究の推進方策

組合せ最適化アルゴリズムの効率化を、ハードウェア・ソフトウェアの両側面から試みる。高効率ランダム射影は、高次元データに関する組合せ最適化に適した効率的な次元削減手法である。パターンの計測と同時にランダム射影する装置の開発も視野にいれ、実用的な組合せパターン認識装置のアーキテクチャの設計や、FPGAによる実装の可能性を検討する。また、時系列データの組合せパターン認識を効率化するため、基本クラスの機械学習や組合せ解の逐次更新法を設計する。
組合せ最適解の有無に基づき既知・未知を判断する「無知の知」の応用および数理的側面の探究を進める。また、検知した未知クラスのテストパターンから自動的に機械学習する仕組みを検討し、自ら知識を獲得するパターン認識系を設計する。
前年度に着手した実証実験を継続する。文字検出・認識では、基本クラスを線画に限定するとその共起関係で偏や旁等が表せることを確認するため、(C2)の問題設定を検討する。また、時系列データへの応用として肺音のパターン認識装置を設計する。
なお、高次元非線形写像の機械学習に関しては、新学術領域研究の公募研究(研究課題番号26120526)で別途遂行する予定である。

次年度の研究費の使用計画

消耗品の購入で生じた端数である。
消耗品の購入で不足が生じる場合に充当する。

  • 研究成果

    (9件)

すべて 2013

すべて 雑誌論文 (5件) (うち査読あり 2件) 学会発表 (3件) 産業財産権 (1件)

  • [雑誌論文] Topology-preserving dimension-reduction methods for image pattern recognition2013

    • 著者名/発表者名
      Hayato Itoh, Tomoya Sakai, Kazuhiko Kawamoto, Atsushi Imiya
    • 雑誌名

      Lecture Notes in Computer Science, Scandinavian Conference on Image Analysis (SCIA 2013) Proceedings

      巻: 7944 ページ: 195-204

    • DOI

      10.1007/978-3-642-38886-6_19

    • 査読あり
  • [雑誌論文] Dimension reduction methods for image pattern recognition2013

    • 著者名/発表者名
      Hayato Itoh, Tomoya Sakai, Kazuhiko Kawamoto, Atsushi Imiya
    • 雑誌名

      Lecture Notes in Computer Science, Similarity-Based Pattern Recognition (SIMBAD) Proceedings

      巻: 7953 ページ: 26-42

    • DOI

      10.1007/978-3-642-39140-8_2

    • 査読あり
  • [雑誌論文] 文字を構成する線画の組合せの機械学習2013

    • 著者名/発表者名
      草野 周太, 酒井 智弥
    • 雑誌名

      第12回情報科学技術フォーラム講演論文集

      巻: - ページ: 239-244

  • [雑誌論文] 文字画像のスパースモデリングと文字検出2013

    • 著者名/発表者名
      草野 周太, 小松 祐太, 酒井 智弥
    • 雑誌名

      第28回信号処理シンポジウム講演論文集

      巻: - ページ: 311-316

  • [雑誌論文] 高次元非線形写像のための圧縮Extreme Learning Machineアルゴリズム2013

    • 著者名/発表者名
      酒井 智弥, 宮田 大輔
    • 雑誌名

      第28回信号処理シンポジウム講演論文集

      巻: - ページ: 330-335

  • [学会発表] 文字画像のスパースモデリングと文字検出2013

    • 著者名/発表者名
      草野 周太, 小松 祐太, 酒井 智弥
    • 学会等名
      第28回信号処理シンポジウム
    • 発表場所
      海峡メッセ下関(山口県下関市)
    • 年月日
      20131121-20131121
  • [学会発表] 高次元非線形写像のための圧縮Extreme Learning Machineアルゴリズム2013

    • 著者名/発表者名
      酒井 智弥, 宮田 大輔
    • 学会等名
      第28回信号処理シンポジウム
    • 発表場所
      海峡メッセ下関(山口県下関市)
    • 年月日
      20131121-20131121
  • [学会発表] 文字を構成する線画の組合せの機械学習2013

    • 著者名/発表者名
      草野 周太, 酒井 智弥
    • 学会等名
      第12回情報科学技術フォーラム
    • 発表場所
      鳥取大学鳥取キャンパス(鳥取県鳥取市)
    • 年月日
      20130904-20130904
  • [産業財産権] 生体音信号処理装置、生体音信号処理方法および生体音信号処理プログラム2013

    • 発明者名
      酒井智弥, 喜安千弥, 宮原末治
    • 権利者名
      酒井智弥, 喜安千弥, 宮原末治
    • 産業財産権種類
      特許
    • 産業財産権番号
      特願2013-220240
    • 出願年月日
      2013-10-23

URL: 

公開日: 2015-05-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi