• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2014 年度 実績報告書

大規模知識基盤形成のための次世代半構造マイニング技術の展開

研究課題

研究課題/領域番号 24240021
研究機関北海道大学

研究代表者

有村 博紀  北海道大学, 情報科学研究科, 教授 (20222763)

研究分担者 宇野 毅明  国立情報学研究所, 大学共同利用機関等の部局等, 教授 (00302977)
湊 真一  北海道大学, 情報科学研究科, 教授 (10374612)
平田 耕一  九州工業大学, その他の研究科, 教授 (20274558)
伊藤 公人  北海道大学, 学内共同利用施設等, 教授 (60396314)
下薗 真一  九州工業大学, その他の研究科, 准教授 (70243988)
喜田 拓也  北海道大学, 情報科学研究科, 准教授 (70343316)
研究期間 (年度) 2012-04-01 – 2016-03-31
キーワード非構造データ / データマイニング / 高次元非構造データ検索 / イベントストリーム処理 / 大規模知識索引 / 知識発見 / ビッグデータ
研究実績の概要

本研究では,実世界と情報世界が融合した巨大な情報空間から有用な知識を効率よくとりだすための大規模半構造マイニング技術の確立を目指す.平成26年度は,大規模知識基盤形成システムのための技術調査と,基盤技術の開発,環境整備について,次の項目に関して研究・開発を行った.
(1)最適パターン発見を用いた超高速半構造マイニングエンジンの研究開発(有村・宇野・平田).従来の超高速パターン発見アルゴリズムを拡張し,グラフデータ中の誘導木など種々の部分グラフ族に対する理論的性能保障付きパターンマイニングアルゴリズムを開発した.(2)時空間情報を用いた半構造データマイニングの研究開発(有村・宇野・平田・下薗).群れパターンを初めとする多次元時空間パターンに対する多項式遅延・領域の高速なパターンマイニングアルゴリズムを開発した.(3)確率的情報スキーマと半構造データマイニングの結合の研究(喜田・伊藤・有村)無限関係モデルを拡張して,多重階層により背景や複数の分類を扱える統計的関係マイニング手法を開発した.(4)大規模知識基盤形成システムのための知識連係技術の研究開発(伊藤,平田,喜田,有村)知識連携の周辺技術として,高速検索を可能にする文法圧縮に基づいた高効率圧縮手法や,高次元空間における大規模近似検索手法を開発した.(5)大規模知識基盤形成システムのための高速な知識索引技術の研究開発(湊,宇野,有村).ZDDを元に,大規模非構造データに拡張した系列二分探索グラフ(SeqBDD)等の大規模知識索引の研究開発を行った.(6)知識基盤形成支援システムのプロトタイプ構築(全員).開発した知識発見技術を元に,実世界からの知識基盤形成システムのプロトタイプの構築を開始した.群れパターン発見では大規模気象データからの知識発見実験を行った.各研究項目に関して,随時,理論的な解析を元にさらなる最適化を行った.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

超高速半構造マイニングエンジンと研究開発に関しては,すでに目標を達成している.具体的には,(1)では,非巡回超グラフの種々の部分族に対する多項式遅延・領域アルゴリズムにおいて部分グラフ系パターンに加えて,誘導部分グラフ系パターンに研究成果を拡張するなど大きな進展が見られ,(2)では,最近注目されるトラジェクトリデータ向けの「群れパターン」に対する世界初の多項式遅延・領域の閉パターン発見アルゴリズムについて,長さ極大と頻度極大の二つのタイプの極大パターン(クローズドパターン)マイニング手法の開発に成功している.また,離散データマイニングに時空間の幾何的構造を導入する試みについて,各種の高速化手法を開発し,実際のデータ上で数百倍から数千倍におよぶ大幅な高速化に成功している.(4)知識連係技術では,系列データなどの大規模非構造データの文法圧縮や,多次元非構造データの大規模検索アルゴリズムの開発に成功しており,応用分野として地理情報システム分野の国際ワークショップで発表している(ICGS2014).(5)では,申請者と分担者らが先端を進んでいる高速な知識索引技術の研究開発で,知識索引の種々の半構造データへの拡張を進めることができた.また,成果が国際誌(Discrete Applied Mathematics)に掲載決定された.他項目についても,(3)で統計的関係データ学習アルゴリズムを開発し,(6)で各項目で開発した理論的手法を実際に実装し,プロトタイプ構築のための計算機実験を行うなど,当初の計画以上に進展している.(4)の高速トラジェクトリデータ検索では2014学生奨励賞(情報処理学会 DBS研究会)を受賞した.これらの研究の進展について解説記事や招待講演を行った(電子情報通信学会誌Vol.97,電気学会全国大会2014など).

今後の研究の推進方策

今後各項目ごとの研究開発の推進を一層進める,それと共に,本課題の最終的な目標である実世界と情報世界が融合した巨大な情報空間から知識を効率よくとりだすための大規模半構造マイニング技術の確立を目指して,その理論的な枠組みや,個々の研究成果の統合,新たな研究課題と方向の策定を行う予定である.いくつかの方向を示すと,(1)超高速半構造マイニングエンジンと研究開発に関しては,これまでに超高速パターン発見が可能なさまざまな木構造パターンのクラスについて,超高速パターン発見アルゴリズムを統一的に一般化し,可能性と限界を明らかにする.(2)では,トラジェクトリデータ向けの高速知識発見手法をさらに追及し,時空間データを扱うための効率よい設計原理を明らかにする.とくに,互いに依存性をもつ複数のパターンから組み立てられる高次パターンの発見に拡張する.同時に,近年発展の著しい統計的に頑健なパターン発見を可能にする統計的実用的で規模耐性の高い実装法を研究開発する.(4)知識連係技術では,これまでのハードウェアの算術演算を最大限に活用する超高速かつ低メモリ性をもつアルゴリズム技法を開発し,圧縮技術やパターン発見技術とつなげることで,超大規模データへの適用方法を確立する.(5)知識索引技術と統計的手法との融合では,大規模知識索引,非構造ストリーム処理,知識発見を有機的に連携させて,知識創出の枠組みを明らかにする.(6)プロトタイプ構築については,これまでの実装の最適化と,プロトタイプ構築を行い,評価実験を行う.

  • 研究成果

    (22件)

すべて 2015 2014 その他

すべて 雑誌論文 (11件) (うち査読あり 10件、 謝辞記載あり 9件) 学会発表 (10件) (うち招待講演 1件) 備考 (1件)

  • [雑誌論文] 大規模軌跡データからの群パターン発見のための実用的アルゴリズム2015

    • 著者名/発表者名
      耿 暁亮, 宇野 毅明, 有村 博紀
    • 雑誌名

      情報処理学会論文誌

      巻: 56 ページ: 1292-1304

    • 査読あり / 謝辞記載あり
  • [雑誌論文] An efficient Variable-to-Fixed length encoding using multiplexed parse trees2015

    • 著者名/発表者名
      S. Yoshida, T. Kida
    • 雑誌名

      Journal of Discrete Algorithms

      巻: 32 ページ: 75-86

    • DOI

      10.1016/j.jda.2014.10.005

    • 査読あり / 謝辞記載あり
  • [雑誌論文] Sequence Binary Decision Diagram: Minimization, Relationship to Acyclic Automata, and Complexities of Boolean Set Operations2015

    • 著者名/発表者名
      Shuhei Denzumi, Ryo Yoshinaka, Hiroki Arimura and Shin-Ichi Minato
    • 雑誌名

      Discrete Applied Mathematics, 2014. (in press)

      巻: 未定 ページ: 未定

    • DOI

      10.1016/j.dam.2014.11.022

    • 査読あり / 謝辞記載あり
  • [雑誌論文] Constant Time Enumeration of Subtrees with Exactly k Nodes in a Tree2014

    • 著者名/発表者名
      Kunihiro Wasa, Yusaku Kaneta, Takeaki Uno, and Hiroki Arimura
    • 雑誌名

      IEICE Trans. Inf. and Syst.

      巻: Vol.E97-D, No.3 ページ: 421-430

    • 査読あり / 謝辞記載あり
  • [雑誌論文] A Fast Method of Statistical Assessment for Combinatorial Hypotheses Based on Frequent Itemset Enumeration2014

    • 著者名/発表者名
      Shin-ichi Minato, Takeaki Uno, Koji Tsuda, Aika Terada, Jun Sese
    • 雑誌名

      Lecture Notes in Computer Science, Springer (Proc. European Conference of Machine Learning and Knowledge Discovery in Databases)

      巻: Vol.8725 ページ: 422-436

    • DOI

      10.1007/978-3-662-44851-9_27

    • 査読あり
  • [雑誌論文] 文字列の圧縮列挙索引技術とパターン照合技術2014

    • 著者名/発表者名
      伝住周平,有村博紀,定兼邦彦
    • 雑誌名

      小特集 「フカシギの数え方」から広がるアルゴリズムの理工学 : 二分決定グラフによる離散構造処理と広がる応用分野, 電子情報通信学会誌

      巻: Vol.97, No.12 ページ: 1080-1085

    • 謝辞記載あり
  • [雑誌論文] DenseZDD: A Compact and Fast Index for Families of Sets2014

    • 著者名/発表者名
      Shuhei Denzumi, Jun Kawahara, Koji Tsuda, Hiroki Arimura, Shin-ichi Minato, and Kunihiko Sadakane
    • 雑誌名

      Lecture Notes in Computer Science, Springer (Proc. 13th International Symposium on Experimental Algorithms, SEA 2014)

      巻: Vol.8504 ページ: 187-198

    • DOI

      10.1007/978-3-319-07959-2_16

    • 査読あり / 謝辞記載あり
  • [雑誌論文] Efficient Enumeration of Induced Subtrees in a K-Degenerate Graph2014

    • 著者名/発表者名
      Kunihiro Wasa, Takeaki Uno, and Hiroki Arimura
    • 雑誌名

      Lecture Notes in Computer Science, Springer (Proc. the 25th International Symposium on Algorithms and Computation)

      巻: Vol.8889 ページ: 94-102

    • DOI

      10.1007/978-3-319-13075-0_8

    • 査読あり / 謝辞記載あり
  • [雑誌論文] Segmental Mapping and Distance for Rooted Labeled Ordered Trees2014

    • 著者名/発表者名
      Tomohiro Kan, Shoichi Higuchi, Kouichi Hirata
    • 雑誌名

      Fundam. Inform.

      巻: Vol.132, No.4 ページ: 461-483

    • DOI

      10.3233/FI-2012-637

    • 査読あり / 謝辞記載あり
  • [雑誌論文] Enumeration of Complete Set of Flock Patterns in Trajectories2014

    • 著者名/発表者名
      Xiaoliang Geng, Takuya Takagi, Hiroki Arimura, and Takeaki Uno
    • 雑誌名

      Proc. the 5th ACM SIGSPATIAL International Workshop on GeoStreaming (IWGS 2014), ACM

      巻: なし ページ: 53-61

    • DOI

      10.1145/2676552.2676560

    • 査読あり / 謝辞記載あり
  • [雑誌論文] Oblivious Evaluation of Non-deterministic Finite Automata with Application to Privacy-Preserving Virus Genome Detection2014

    • 著者名/発表者名
      Hirohito Sasakawa, Hiroki Harada, Dave duVerle, Hiroki Arimura, Koji Tsuda, Jun Sakuma
    • 雑誌名

      The 13th Workshop on Privacy in the Electronic Society (WPES 2014), ACM

      巻: なし ページ: 21-30

    • DOI

      10.1145/2665943.2665954

    • 査読あり
  • [学会発表] A Scalable Architecture for Data Storage and Retrieval in Real-time Data Assimilation in Meteorology2015

    • 著者名/発表者名
      Mayumbo Nyirenda
    • 学会等名
      The fourth International Symposium on Data Assimilation (ISDA2015), poster
    • 発表場所
      RIKEN Advanced Institute for Computational Science, AICS (Kobe, Japan)
    • 年月日
      2015-02-23 – 2015-02-26
  • [学会発表] High Dimensional Similarity Search with Bundled Query Processing on Hilbert R-Tree2015

    • 著者名/発表者名
      Yohei Nasu, Naoki Kishikawa, Kei Tashima, Shin Kodama, Yasunobu Imamura, Takeshi Shinohara, Koichi Hirata and Tetsuji Kuboyama
    • 学会等名
      The 5th International Conference on Pattern Recognition Applications and Methods (ICPRAM 2016)
    • 発表場所
      Lisbon Marriott Hotel (Lisbon, Portugal)
    • 年月日
      2015-01-10 – 2015-01-12
  • [学会発表] 大規模トラジェクトリ照合のためのビット並列計算を用いた省メモリアルゴリズム2014

    • 著者名/発表者名
      笹川 裕人, 山本 雅大, 栗田 和宏, 有村 博紀
    • 学会等名
      第7回Webとデータベースに関するフォーラム (WebDB Forum 2014) (2014年11月20日に情報処理学会データベースシステム研究会「学生奨励賞」を受賞)
    • 発表場所
      芝浦工業大 (Tokyo, Japan)
    • 年月日
      2014-11-19 – 2014-11-20
  • [学会発表] Bit-parallel Approximate Trajectory Matching for 2-dimensional Trajectory Data2014

    • 著者名/発表者名
      Hirohito Sasakawa, Masahiro Yamamoto, Kazuhiro Kurita, and Hiroki Arimura
    • 学会等名
      The 17th Japan Conference on Discrete and Computatoinal Geometry and Graphs (JCDCGG 2014)
    • 発表場所
      Tokyo Science University (Kagurazaka, Tokyo)
    • 年月日
      2014-09-15 – 2014-09-16
  • [学会発表] Dense符号化のための文法圧縮分割2014

    • 著者名/発表者名
      正木拓也,笹川裕人,喜田拓也
    • 学会等名
      第149回アルゴリズム研究会
    • 発表場所
      伝国の杜 (米沢市)
    • 年月日
      2014-09-12 – 2014-09-12
  • [学会発表] 実世界非構造データからの高速マイニング ~エネルギーデータの高度利用に向けて~2014

    • 著者名/発表者名
      有村博紀
    • 学会等名
      シンポジウムセッションTC「エネルギービッグデータの解析と利用」, 平成26年電気学会電子・情報・システム部門大会
    • 発表場所
      島根大学松江キャンパス(松江市)
    • 年月日
      2014-09-03 – 2014-09-05
    • 招待講演
  • [学会発表] 二次元軌跡データに対する高速なパターン照合アルゴリズム2014

    • 著者名/発表者名
      山本雅大、栗田和宏、笹川裕人、有村博紀
    • 学会等名
      第13回情報科学技術フォーラム講演論文集(FIT2014), 情報処理学会・電子情報通信学会
    • 発表場所
      筑波大学 (筑波市)
    • 年月日
      2014-09-03 – 2014-09-05
  • [学会発表] 日本語テキストに対する検索指向符号化のための文法圧縮分割2014

    • 著者名/発表者名
      正木拓也,笹川裕人,喜田拓也
    • 学会等名
      FIT2014 第13回情報科学技術フォーラム
    • 発表場所
      筑波大学 (筑波市)
    • 年月日
      2014-09-03 – 2014-09-05
  • [学会発表] Fast Regular Expression Matching Based on Dual Glushkov NFA2014

    • 著者名/発表者名
      Ryutaro Kurai, Norihito Yasuda, Hiroki Arimura, Shinobu Nagayama, Shin-ichi Minato
    • 学会等名
      Prague Stringology Conference 2014 (PSC'14)
    • 発表場所
      Czech Technical University (Prague, Czech)
    • 年月日
      2014-09-01 – 2014-09-03
  • [学会発表] K-縮退グラフに含まれる誘導木の列挙2014

    • 著者名/発表者名
      和佐州洋,有村博紀,宇野毅明
    • 学会等名
      第148回 アルゴリズム研究会,情報処理学会
    • 発表場所
      大和屋 (松山市,愛媛)
    • 年月日
      2014-06-13 – 2014-06-14
  • [備考] Publications: Hiroki Arimura

    • URL

      http://www-ikn.ist.hokudai.ac.jp/~arim/publication.html

URL: 

公開日: 2016-06-01  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi