• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2012 年度 実績報告書

データ圧縮に基づく知識発見の理論と応用に関する研究

研究課題

研究課題/領域番号 23300051
研究機関東北大学

研究代表者

篠原 歩  東北大学, 情報科学研究科, 教授 (00226151)

研究分担者 成澤 和志  東北大学, 情報科学研究科, 助教 (40583323)
研究期間 (年度) 2011-04-01 – 2015-03-31
キーワード機械学習 / 人工知能 / データ圧縮 / 知識発見 / アルゴリズム
研究概要

文字列の多重集合をマルチトラック文字列とよび,その上での新しいパターン照合としてトラック間の置換を許した順列パターン照合を定式化した.これは複数のセンサーデータ系列に内在するパターンの検出をモデル化したものである.置換によってトラック数Nに関してN!通りの組み合わせ爆発が起こるため,素朴な方法では現実的な大きさのNに対して全く歯が立たない.この問題に対して,オートマトンを用いた効率のよいアルゴリズムを提案し,その計算量を解析した.また,データベースに蓄えたマルチトラックデータに対する検索に有用な索引構造として,マルチトラック接尾辞木と,マルチトラック・ポジションヒープを提案し,その構築アルゴリズムを示した.さらに,通常の文字列に対して文字の置換を許したパラメータ化照合に対しても,ポジションヒープが定義でき,それを効率よく構築できることを示した.また,直線的プログラムで圧縮表現された文字列とパターンの照合問題である圧縮パターン照合問題に対して,ハッシュを用いた確率的なアプローチによって従来法よりも省領域で照合が行えるアルゴリズムを提案した.
一方,文字列の基本的な繰り返し構造に関して,左右に延長不可能な極大の繰り返し構造である「連」についての研究をさらに押し進めた.長さnの文字列に含まれる連の最大数ρ(n)に関する「連予想」ρ(n)<n について,本研究では文字列に内在する性質を利用して探索空間の削減したアルゴリズムの開発と実装の工夫により,これがn≦57までは成立していることを検証した.あわせてそこまでのρ(n)の厳密な値とそれを与える文字列を具体的に求めた.これらの文字列の系列に特有のパターンが見つけていくことが今後の課題として残っている.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

本研究は,知識発見の原理の究明と実働化を目指して,特にデータ圧縮の技術との関連に着目しながら理論と応用の両面から研究を展開しているものである.理論面に関しては,上述の通り,マルチトラック文字列の照合問題という新たな問題を定式化し,それを効率
よく解くことができた.また圧縮された文字列を展開することなく照合するという課題に対しても進展があった.さらに,データ圧縮の重要な要素となる繰り返し構造について,最も基本的な文字列としての性質に関する連の最大数に関しても進展があった.
一方,応用面に関しては,申請書に記載したように,ゲームAIやロボット制御に関する実問題への取り組みにも力を入れている.ETロボコンにおいて,東北地区大会,そしてチャンピオンシップ大会それぞれにおいて優秀な成績を残すことができた.
以上のことから,おおむね順調に進展していると自己評価している.

今後の研究の推進方策

おおむね順調に研究が進展しているので,理論面と応用面,それぞれの方向について,当初の計画に沿って研究を進めて行く予定である.
まず,今年度の研究で得られたマルチトラック文字列の照合問題に関しては,実応用を目指すためには特に,小さな相違や誤りを許した近似照合に取り組む必要がある.特にセンサーのような数値列や画像を対象とする場合には,厳密照合だけにこだわっていてはあまり有用な応用は見込めない.しかしながら一般に,通常の文字列においても,近似を許した照合となると急に計算量が増大することが知られている.特に文字列の挿入や削除によって長さが異なる可能性のある場合にはさらに困難な問題となる.本研究において我々は,トラック間の置換も許した照合を行おうとしているため,現状のハードウエアで現実的なデータに対する実働システムを構築するためには,さまざまな工夫が必要となる.今後は,ハッシュや近傍探索の手法に着目することでそれを打破することを目指す.
一方,文字列の繰り返し構造である連については,その個数のみならず,指数和という尺度に注目する予定である.文字列の指数和の最大数についてもその上界と下界の間のギャップを縮める研究が近年,精力的に行われているが,我々も大規模な計算機実験を併用しながらこの課題にチャレンジしていく予定である.
応用面に関しても,昨年度と同様に,それぞれの具体的な問題に対して取り組み,そこで得られる知見を理論解析にフィードバックさせることで相補的なさらなる進展を目指す.

  • 研究成果

    (8件)

すべて 2013 2012 その他

すべて 雑誌論文 (2件) (うち査読あり 2件) 学会発表 (6件)

  • [雑誌論文] Permuted Pattern Matching on Multi-track Strings2013

    • 著者名/発表者名
      Takashi Katsura, Kazuyuki Narisawa, Ayumi Shinohara, Hideo Bannai, Shunsuke Inenaga
    • 雑誌名

      Proc. 39th International Conference on Current Trends in Theory and Practice of Computer Science

      巻: LNCS 7741 ページ: 280-291

    • DOI

      10.1007/978-3-642-35843-2_25

    • 査読あり
  • [雑誌論文] Computing Maximum Number of Runs in Strings2012

    • 著者名/発表者名
      Kazuhiko Kusano, Kazuyuki Narisawa, Ayumi Shinohara
    • 雑誌名

      Proc. 19th International Symposium String Processing and Information Retrieval

      巻: LNCS 7608 ページ: 318-329

    • DOI

      10.1007/978-3-642-34109-0_33

    • 査読あり
  • [学会発表] 種々のパターン照合問題に対するポジションヒープの構築

    • 著者名/発表者名
      大友雄平,成澤和志,篠原歩
    • 学会等名
      電子情報通信学会コンピュテーション研究会
    • 発表場所
      九州大学
  • [学会発表] 実ロボット自動テストシステムSATORI2を用いた難所戦略の妥当性の検証

    • 著者名/発表者名
      大井雄介,ディプタラマ,奥田遼介,桂敬史,成澤和志,篠原歩
    • 学会等名
      電気学会制御研究会
    • 発表場所
      関東学院大学
  • [学会発表] 組込環境用プロセス仮想マシンの実装とETロボコンへの適用

    • 著者名/発表者名
      奥田遼介,成澤和志,篠原歩
    • 学会等名
      電気学会制御研究会
    • 発表場所
      関東学院大学
  • [学会発表] 圧縮文字列に対する省メモリなパターンマッチアルゴリズム

    • 著者名/発表者名
      相原高雄,篠原歩,成澤和志
    • 学会等名
      電子情報通信学会コンピュテーション研究会
    • 発表場所
      東北大学
  • [学会発表] マルチトラック文字列の順列パターン照合と索引構造

    • 著者名/発表者名
      桂敬史,成澤和志,篠原歩,坂内英夫,稲永俊介
    • 学会等名
      電子情報通信学会コンピュテーション研究会
    • 発表場所
      法政大学
  • [学会発表] 役を構成するゲームに対する効率的な行動決定アルゴリズムの提案

    • 著者名/発表者名
      小松智希,成澤和志,篠原歩
    • 学会等名
      第28回ゲーム情報学研究会
    • 発表場所
      静岡県立大学

URL: 

公開日: 2014-07-24  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi