• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2015 年度 実施状況報告書

グラフ文法圧縮データからの省メモリ高速グラフマイニング手法の開発

研究課題

研究課題/領域番号 15K00313
研究機関広島市立大学

研究代表者

内田 智之  広島市立大学, 情報科学研究科, 准教授 (70264934)

研究分担者 正代 隆義  九州国際大学, 国際関係学部, 教授 (50226304)
宮原 哲浩  広島市立大学, 情報科学研究科, 准教授 (90209932)
研究期間 (年度) 2015-04-01 – 2019-03-31
キーワードアルゴリズム / グラフ文法圧縮 / データマイニング / 機械学習
研究実績の概要

研究課題の目的は、既存の文字列上の文法圧縮法を、超辺書換グラフ文法を用いてビッググラフデータを可逆圧縮するグラフ文法圧縮法に拡張し、グラフ文法圧縮がもたらす超効率グラフマイニング手法を開発することで、グラフ構造を有するビッググラフデータからより広くより深い知識を抽出する、省メモリ高速グラフマイニング手法を開発することである。初年度にあたる平成27年度は、主として以下の2テーマについて研究を行った。
1. グラフ文法圧縮の理論展開:文字列を対象とした文法圧縮手法について調査し、これまでに蓄積されたグラフ文法に関する知見から文脈自由グラフ文法の一つである超辺書換グラフ文法(HRGG)を用いたグラフ文法圧縮手法へ拡張する際の理論的諸問題について考察した。また、無順序木や外平面グラフのクラスを対象としたグラフ文法圧縮手法およびそれらグラフクラスの圧縮データを対象とした高速マイニング手法についても並行して研究を行った。その結果、計算量的困難が伴うグラフクラスを扱う前に、これまでに多くの知見を有している順序木のクラスを対象としたグラフ文法圧縮手法についての理論展開を行うこととした。
2. グラフ文法圧縮データに対する省メモリパターンマッチングアルゴリズムの開発:1で得られた知見をもとに、制限されたHRGGにより構造圧縮された順序木を圧縮項木と定義し、その圧縮項木上で頻出するパスを陽に展開することなく高速に枚挙するアルゴリズムを提案し、計算機上に実装を行い、人工データを用いた評価実験結果を示して提案アルゴリズムの頑強性・高速性を示した。今後、この提案手法を圧縮項木からの頻出部分木の抽出に拡張し、さらに圧縮項木データから特徴的な木構造パターンを高速に抽出する手法へと展開していく予定である。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

初年度となる平成27年度は、1. グラフ文法圧縮の理論展開、2. グラフ文法圧縮データに対する省メモリパターンマッチングアルゴリズムの開発を研究テーマとして計画した。
研究テーマ1において、文字列文法圧縮手法に関する研究成果について調査し、超辺書換グラフ文法(HRGG)圧縮へ拡張可能であることを確認した。その過程で、グラフ文法圧縮の対象とするグラフクラスをまずは順序木のクラスに限定し、与えられた巨大な順序木を生成するできるだけ小さなサイズのHRGGを構築する最適化問題について検討することにした。この検討結果から、当初計画から若干の軌道修正を行った。研究テーマ2において、1の軌道修正に基づき、制限されたHRGGにより圧縮された順序木を陽に解凍することなく頻出するパスを抽出する手法を提案し、大きな人工データを用いた評価実験を行ってその有用性を示した。
初年度である平成27年度は基礎的な理論展開を行う計画であったため、これまでに公表されている関連研究調査を行うなど、今後の理論展開の礎を築くことができたと考えている。また、対象とするグラフのクラスを制限したことで、ある制限のもとで定義されたHRGG圧縮データから陽に展開することなく頻出するパスを枚挙するアルゴリズムを提案し、計算機上に実装した上で評価実験まで行えたことは計画以上の成果だと考えている。
全体としては、軌道修正を行ったことでの遅れを考慮しても概ね順調に進展していると判断している。

今後の研究の推進方策

グラフ文法圧縮の理論展開に関して、平成27年度に行った若干の軌道修正に基づき、今後は順序木のクラスについてできるだけ小さなサイズにグラフ文法圧縮する手法の開発と、そのグラフ文法圧縮された順序木を対象とした機械学習手法、とくに質問学習および帰納推論、について理論展開していく。また、グラフ文法圧縮された順序木に対する成果を、無順序木、TTSPグラフ、外平面的グラフへと順次拡張していく予定である。
グラフ文法圧縮データに対する省メモリパターンマッチングアルゴリズムの開発に関しては、まずは平成27年度に得られた研究成果を、より制限の少ないHRGGにより圧縮された順序木を陽に解凍することなく頻出するグラフ構造(部分木など)を抽出する手法に拡張し、さらにグラフ文法圧縮データから特徴的な木構造パターンを枚挙する手法へと展開していく予定である。そのために、平成28年度中に購入予定の計算機と現有の計算機と使って提案手法の実装およびより大きなデータを対象とした評価実験を繰り返し省メモリ・高速な手法へと昇華させていくための計算機環境を整える予定である。また、研究過程で得られた研究成果はできるだけ迅速に国内および国際会議で発表し、雑誌等へ投稿する予定である。

次年度使用額が生じた理由

以下の理由により次年度使用額が生じた。
平成27年度中に得られた研究成果を国内・海外発表するための旅費やそれに伴う学会参加費、研究分担者および研究連携者間の研究打合せをSkypeミーティング等で行ったことと、研究計画の若干の軌道修正を行ったことにより、平成27年度末に購入する予定の計算機の購入時期を半年程度遅らせることとしたことによる。

次年度使用額の使用計画

平成27年度中にはまとめきれずに残ってしまった未発表成果を、国際会議あるいは国内会議で順次発表していくための旅費・学会参加費、論文投稿費等に充当する予定である。さらに、国際会議で発表した論文を順次Journalに投稿していく予定であるが、投稿前には必ず論文校正を行う必要がある。そのための費用も確保しておく必要がある。また半年程度購入時期を遅らせた計算機を平成28年度中頃には購入する予定である。

  • 研究成果

    (2件)

すべて 2016 2015

すべて 学会発表 (2件) (うち国際学会 1件)

  • [学会発表] LZ法に基づいて構造圧縮された順序木構造データに対する頻出パス枚挙アルゴリズム2016

    • 著者名/発表者名
      堀部智也、糸川裕子、内田智之、宮原哲浩、鈴木祐介
    • 学会等名
      2015年度 火の国情報シンポジウム2016
    • 発表場所
      国立大学法人宮崎大学
    • 年月日
      2016-03-02 – 2016-03-03
  • [学会発表] Acquisition of Characteristic Block Preserving Outerplanar Graph Patterns from Positive and Negative Data using Genetic Programming and Tree Representation of Graph Patterns2015

    • 著者名/発表者名
      Yuto Ouchiyama, Tetsuhiro Miyahara, Yusuke Suzuki, Tomoyuki Uchida, Tetsuji Kuboyama, Fumiya Tokuhara
    • 学会等名
      2015 IEEE 8th International Workshop on Computational Intelligence and Applications
    • 発表場所
      Hiroshima City University
    • 年月日
      2015-11-06 – 2015-11-07
    • 国際学会

URL: 

公開日: 2017-01-06  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi