• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2016 Fiscal Year Annual Research Report

実世界知識基盤形成のための次世代半構造マイニング技術の研究

Research Project

Project/Area Number 16H01743
Research InstitutionHokkaido University

Principal Investigator

有村 博紀  北海道大学, 情報科学研究科, 教授 (20222763)

Co-Investigator(Kenkyū-buntansha) 宇野 毅明  国立情報学研究所, 情報学プリンシプル研究系, 教授 (00302977)
湊 真一  北海道大学, 情報科学研究科, 教授 (10374612)
平田 耕一  九州工業大学, 大学院情報工学研究院, 教授 (20274558)
伊藤 公人  北海道大学, 人獣共通感染症リサーチセンター, 教授 (60396314)
下薗 真一  九州工業大学, 大学院情報工学研究院, 准教授 (70243988)
喜田 拓也  北海道大学, 情報科学研究科, 准教授 (70343316)
Project Period (FY) 2016-04-01 – 2020-03-31
Keywords非構造データ / 意味マイニング / 時空間データマイニング / イベントストリーム処理 / 高次元非構造データ検索 / 大規模知識索引 / 知識発見 / ビッグデータ
Outline of Annual Research Achievements

本研究では,実世界と情報世界が融合した巨大な情報空間からの知識基盤形成のための次世代半構造マイニング技術の確立を目指す.平成28年度は,次の項目に関して,大規模知識基盤形成システムの技術調査と基盤技術の研究・開発を行った.
(1)最適パターン発見を用いた超高速半構造マイニングエンジンの研究開発(有村・宇野・平田).従来のパターン発見手法に基づいて,パターンに時間変化と複合論理演算を許した「意味マイニング」に取り組み,超高速列挙に基づく順序決定木の厳密最適化学習に関する理論的性能保障付き高速アルゴリズムを開発した.(2)時空間情報を用いた半構造データマイニングの研究開発(有村・宇野・平田・下薗).群れパターンと点集合パターンなど,高次元時空間パターンに対する多項式遅延・領域の高速なパターンマイニングとパターン照合手法をを開発した.(3)確率的情報スキーマと半構造データマイニングの結合の研究(喜田・伊藤・有村)無限関係モデルを拡張して,オブジェクトの関与度を扱える統計的関係マイニング手法を開発した.(4)大規模知識基盤形成システムのための知識連係技術の研究開発(伊藤,平田,喜田,有村)知識連携の周辺技術として,高速検索を可能にする文法圧縮に基づいた高効率圧縮手法や,高次元空間における大規模近似検索手法を開発した.(5)大規模知識基盤形成システムのための高速な知識索引技術の研究開発(湊,宇野,有村).ゼロサプレス二分決定グラフ(ZDD)技術に基づいて,大規模非構造データ向けSeqBDDやPiDD等の大規模知識索引を用いた離散構造最適化の研究開発を行った.(6)知識基盤形成支援システムのプロトタイプ構築(全員).開発した知識発見技術を元に,実世界からの知識基盤形成システムのプロトタイプの構築を開始した.各研究項目に関して,随時,理論的な解析を元にさらなる最適化を行った.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

実世界知識基盤形成技術の確立に向けて,現在,研究はおおむね順調に進展している.具体的な進捗状況は,次の通りである.(1)では,最も広く用いられる知識表現の一つである決定木の列挙問題に取り組み,従来の指数的メモリ手法を大幅に改善して,順序決定木と呼ばれる部分族に対して,多項式メモリ列挙に関する理論的手法を開発し,これに基づいてこの族に対する厳密最適化学習アルゴリズムを得た(第102回SIG-FPAI, DEIM2017).これは,表現力豊かな表現族である決定木の部分族に関して列挙に基づく網羅的なマイニングが可能になることを意味しており,本課題の今後の他の項目の研究すべての土台となる重要な成果である.(2)では,最近注目される移動データからの「群れパターン」発見の多項式遅延・領域の閉パターン発見アルゴリズムについて,より一般的なイベント時系列へ拡張するための検討を行った.半構造マイニング技術を3次元連続空間の点集合マッチングに適用し,平均二乗和距離(RMSD)に関して高速なアルゴリズムの開発に成功した.前者の研究に関して,先に出版した論文が情報処理学会論文賞を受賞し,後者の研究は,2016年度 情報処理学会山下記念賞と情報処理学会第79回全国大会学生奨励賞を受賞した.(3)では,大規模関係データに関する学習アルゴリズムを研究し,国際会議で発表した.(4)では,知識連携技術に関して,系列データなどの大規模非構造データの文法圧縮や,多次元非構造データの大規模検索,複数の文字列ストリームからのオンライン索引構築のアルゴリズムの開発に成功している.(5)では,効率良い知識索引技術において,知識索引の種々の半構造データと最適化問題への拡張を進めた.(6)で各項目で開発した理論的手法を実際に実装し,プロトタイプ構築のための計算機実験を行うなど,当初の計画どおり,おおむね順調に進展している.

Strategy for Future Research Activity

今後,各項目ごとに次のように研究を推進する予定である.(1)の意味マイニングに関しては,今年度開発した順序決定木に関する超高速マイニングアルゴリズムを,各種のデータ構造やスコア関数に拡張し,幅広い知識獲得問題に適用可能にする.とくに,今年度の成果であるただ一つの最適決定木の計算拡張し,トップ-K決定木や,精度と制約を満たす決定木の計数問題,信頼度計算問題の効率良いアルゴリズムを追求する.(2)では,(1)で開発した手法を,論理的な演算子だけでなく,連接や滑り窓付き合成のような時間演算に拡張し,とくに複合エピソード族等の時間変化を許すパターン族に拡張し,時空間データを扱うための効率よい設計原理を明らかにする.とくに,さらに,トラジェクトリデータ向けの高速知識発見手法をさらに追及し,(3)同時に,これらの手法を,近年発展の著しい統計的に頑健なパターン発見を可能にする統計的実用的で規模耐性の高い実装法を研究開発する.(4)知識連係技術では,系列データなどの大規模非構造データの文法圧縮や,多次元非構造データの大規模検索アルゴリズムの開発を一層進める.さらに,現代の並列ハードウェアの特性を活用した超高速かつ低メモリ性をもつアルゴリズム技法を開発し,開発した技法とつなげることで,超大規模データへの適用方法を確立する.(5)知識索引技術と統計的手法との融合では,大規模知識索引,高速マイニング,知識発見を有機的に連携させて,実世界知識基盤形成の枠組みを明らかにする.(6)半構造マイニングの一般理論の構築に関しては,前年度開発した(1)~(5)項の成果を一般化して,各種の構成演算をもつ離散構造データからのマイニング手法の一般理論を構築する.(6)プロトタイプ構築については,これまでの実装の最適化と,プロトタイプ構築を行い,評価実験を行う.

  • Research Products

    (26 results)

All 2017 2016 Other

All Int'l Joint Research (1 results) Journal Article (12 results) (of which Int'l Joint Research: 2 results,  Peer Reviewed: 12 results,  Open Access: 1 results) Presentation (9 results) (of which Int'l Joint Research: 1 results) Book (3 results) Remarks (1 results)

  • [Int'l Joint Research] University of Zambia(Zambia)

    • Country Name
      Zambia
    • Counterpart Institution
      University of Zambia
  • [Journal Article] Packed Compact Tries: A Fast and Efficient Data Structure for Online String Processing2017

    • Author(s)
      Takuya Takagi, Shunsuke Inenaga, Kunihiko Sadakane, Hiroki Arimura
    • Journal Title

      Special Issue on Discrete Mathematics and Its Applications, IEICE Trans. Inf. and Syst.

      Volume: 印刷中 Pages: 印刷中

    • Peer Reviewed
  • [Journal Article] Tai Mapping Hierarchy for Rooted Labeled Trees Through Common Subforest2017

    • Author(s)
      Takuya Yoshino, Kouichi Hirata
    • Journal Title

      Theory Comput. Syst.

      Volume: Vol.60, No.4 Pages: 759-783

    • DOI

      10.1007/s00224-016-9705-1

    • Peer Reviewed
  • [Journal Article] Dancing with Decision Diagrams: A Combined Approach to Exact Cover2017

    • Author(s)
      Masaaki Nishino, Norihito Yasuda, Shin-ichi Minato and Masaaki Nagata
    • Journal Title

      In Proc. of the 31st AAAI Conference on Artificial Intelligence (AAAI2017)

      Volume: - Pages: 868-874

    • Peer Reviewed
  • [Journal Article] Mining preserving structures in a graph sequence2016

    • Author(s)
      Takeaki Uno, Yushi Uno
    • Journal Title

      Theor. Comput. Sci.

      Volume: Vol.654 Pages: 155-163

    • DOI

      10.1016/j.tcs.2015.12.007

    • Peer Reviewed
  • [Journal Article] Sequence Binary Decision Diagram: Minimization, Relationship to Acyclic Automata, and Complexities of Boolean Set Operations2016

    • Author(s)
      Shuhei Denzumi, Ryo Yoshinaka, Hiroki Arimura, and Shin-ichi Minato
    • Journal Title

      Discrete Applied Mathematics

      Volume: Vol.212 Pages: 61-80

    • DOI

      10.1016/j.dam.2014.11.022

    • Peer Reviewed
  • [Journal Article] The Relevance Dependent Infinite Relation Model for Discovering Co-Cluster Structure from Relationships with Structured Noise2016

    • Author(s)
      Iku Ohama, Hiromi Iida, Takuya Kida, and Hiroki Arimura
    • Journal Title

      IEICE Trans. Inf. and Syst.

      Volume: Vol.E99-D, No.4 Pages: -

    • Peer Reviewed
  • [Journal Article] Estimating the Lineage Dynamics of Human Influenza B Viruses2016

    • Author(s)
      Mayumbo Nyirenda, Ryosuke Omori, Heidi L. Tessmer, Hiroki Arimura, Kimihito Ito
    • Journal Title

      PLoS ONE

      Volume: 11(11) Pages: -

    • DOI

      10.1371/journal.pone.0166107

    • Peer Reviewed / Int'l Joint Research
  • [Journal Article] Packed Compact Tries: A Fast and Efficient Data Structure for Online String Processing2016

    • Author(s)
      TakuyaTakagi, Shunsuke Inenaga, Kunihiko Sadakane, Hiroki Arimura
    • Journal Title

      Lecture Notes in Computer Science, Springer

      Volume: Vol.9843 Pages: -

    • DOI

      10.1007/978-3-319-44543-4_17

    • Peer Reviewed
  • [Journal Article] Fast Hilbert Sort Algorithm Without Using Hilbert Indices2016

    • Author(s)
      Yasunobu Imamura, Takeshi Shinohara, Kouichi Hirata, Tetsuji Kuboyama
    • Journal Title

      Lecture Notes in Computer Science

      Volume: Vol.9939 Pages: 259-267

    • DOI

      10.1007/978-3-319-46759-7_20

    • Peer Reviewed
  • [Journal Article] Fully-online construction of suffix trees for multiple texts2016

    • Author(s)
      Takuya Takagi, Shunsuke Inenaga and Hiroki Arimura
    • Journal Title

      Proc. the 27th Annual Symposium on Combinatorial Pattern Matching (CPM'16), Leibniz International Proceedings in Informatics (LIPIcs), DROPS

      Volume: Vol.54 Pages: 22:1--22:13

    • Peer Reviewed / Open Access
  • [Journal Article] Relaxing the data access bottleneck of geographic big-data analytics applications using distributed quad trees2016

    • Author(s)
      Mayumbo Nyirenda, Hiroki Arimura, Kimihito Ito
    • Journal Title

      Proc. 5th International Conference on Multimedia Computing and Systems (ICMCS'16), IEEE

      Volume: ID-111 Pages: -

    • DOI

      10.4230/LIPIcs.CPM.2016.22

    • Peer Reviewed / Int'l Joint Research
  • [Journal Article] The Complexity of Induced Tree Reconfiguration Problems2016

    • Author(s)
      Kunihiro Wasa, Katsuhisa Yamanaka, Hiroki Arimura
    • Journal Title

      Proc. 10th International Conference on Language and Automata Theory and Applications (LATA 2016), Lecture Notes in Computer Science, Springer

      Volume: Vol.9618 Pages: 330-342

    • DOI

      10.1007/978-3-319-30000-9_26

    • Peer Reviewed
  • [Presentation] 正規化ハミング距離を用いた三次元点集合マッチングの高速化とインフルエンザウイルス解析への応用2017

    • Author(s)
      佐々木耀一,渋谷哲朗,大森亮介,伊藤公人,有村博紀
    • Organizer
      情報処理学会第79回全国大会
    • Place of Presentation
      名古屋大学 東山キャンパス(名古屋市)
    • Year and Date
      2017-03-16 – 2017-03-18
  • [Presentation] 高階圧縮における連続パターンのコンパクトな表現法2017

    • Author(s)
      古谷勇,喜田拓也
    • Organizer
      第162回アルゴリズム研究会,情報処理学会
    • Place of Presentation
      湯布院公民館(大分県由布市)
    • Year and Date
      2017-03-13 – 2017-03-14
  • [Presentation] ラベル情報と構造情報の相関を用いた三次元点集合マッチングの高速化とそのインフルエンザウイルス解析への応用2017

    • Author(s)
      佐々木 耀一,渋谷 哲朗,大森 亮介,伊藤 公人,有村 博紀
    • Organizer
      第9回データ工学と情報マネジメントに関するフォーラム (DEIM 2017),電子情報通信学会,日本データベース学会,情報処理学会
    • Place of Presentation
      高山グリーンホテル(岐阜県高山市)
    • Year and Date
      2017-03-06 – 2017-03-08
  • [Presentation] 最適な順序付き決定木の高速発見とその文書分類への応用2017

    • Author(s)
      長部 和仁,宇野 毅明,有村 博紀
    • Organizer
      第9回データ工学と情報マネジメントに関するフォーラム (DEIM 2017),電子情報通信学会,日本データベース学会,情報処理学会
    • Place of Presentation
      高山グリーンホテル(岐阜県高山市)
    • Year and Date
      2017-03-06 – 2017-03-08
  • [Presentation] DAGの簡潔表現について2017

    • Author(s)
      高木 拓也,有村 博紀
    • Organizer
      第9回データ工学と情報マネジメントに関するフォーラム (DEIM 2017),電子情報通信学会,日本データベース学会,情報処理学会
    • Place of Presentation
      高山グリーンホテル(岐阜県高山市)
    • Year and Date
      2017-03-06 – 2017-03-08
  • [Presentation] 花画像データセットの構築と畳み込みニューラルネットワークによる分類2017

    • Author(s)
      三浦 健太,喜田 拓也
    • Organizer
      第9回データ工学と情報マネジメントに関するフォーラム (DEIM 2017),電子情報通信学会,日本データベース学会,情報処理学会
    • Place of Presentation
      高山グリーンホテル(岐阜県高山市)
    • Year and Date
      2017-03-06 – 2017-03-08
  • [Presentation] 長さ4の閉路を含まないグラフにおける誘導マッチングのならし定数時間列挙2017

    • Author(s)
      栗田 和宏, 和佐 州洋, 宇野 毅明, 有村 博紀
    • Organizer
      2016年度冬のLAシンポジウム
    • Place of Presentation
      京都大学 数理解析研究所(京都市)
    • Year and Date
      2017-02-01 – 2017-02-03
  • [Presentation] アイテム集合列挙に基づく最適な順序付き決定木の高速発見2016

    • Author(s)
      長部 和仁, 宇野 毅明, 有村 博紀
    • Organizer
      人工知能学会 第102回人工知能基本問題研究会 (第102回SIG-FPAI)
    • Place of Presentation
      JR博多シティ(福岡市)
    • Year and Date
      2016-12-12 – 2016-12-13
  • [Presentation] Efficient Enumeration of Induced Matchings in Graphs without Short Cycles2016

    • Author(s)
      Kazuhiro Kurita, Kunihiro Wasa, Takeaki Uno, Hiroki Arimura
    • Organizer
      Japan Conference on Discrete and Computational Geometory, Graphs, and Games 2016 (JCDCG^3 2016)
    • Place of Presentation
      Tokyo University of Science (Kagurazaka Campus, Tokyo)
    • Year and Date
      2016-09-02 – 2016-09-04
    • Int'l Joint Research
  • [Book] Frequent Pattern Mining, Encyclopedia of Algorithms2016

    • Author(s)
      Takeaki Uno(分担執筆)
    • Total Pages
      1166(785-789)
    • Publisher
      Springer
  • [Book] Amortized Analysis on Enumeration Algorithms, Encyclopedia of Algorithms2016

    • Author(s)
      Takeaki Uno(分担執筆)
    • Total Pages
      1166(72-76)
    • Publisher
      Springer
  • [Book] 確率的グラフィカルモデル(離散構造処理の技法と確率モデル、第5章、鈴木譲 編著)2016

    • Author(s)
      湊真一
    • Total Pages
      292(125-144)
    • Publisher
      共立出版
  • [Remarks] 北海道大学,情報知識ネットワーク研究室

    • URL

      http://www-ikn.ist.hokudai.ac.jp

URL: 

Published: 2018-01-16  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi