• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2018 Fiscal Year Annual Research Report

実世界知識基盤形成のための次世代半構造マイニング技術の研究

Research Project

Project/Area Number 16H01743
Research InstitutionHokkaido University

Principal Investigator

有村 博紀  北海道大学, 情報科学研究科, 教授 (20222763)

Co-Investigator(Kenkyū-buntansha) 宇野 毅明  国立情報学研究所, 情報学プリンシプル研究系, 教授 (00302977)
湊 真一  京都大学, 情報学研究科, 教授 (10374612)
平田 耕一  九州工業大学, 大学院情報工学研究院, 教授 (20274558)
伊藤 公人  北海道大学, 人獣共通感染症リサーチセンター, 教授 (60396314)
下薗 真一  九州工業大学, 大学院情報工学研究院, 准教授 (70243988)
喜田 拓也  北海道大学, 情報科学研究科, 准教授 (70343316)
Project Period (FY) 2016-04-01 – 2020-03-31
Keywords非構造データ / 意味マイニング / 時空間データマイニング / イベントストリーム処理 / 高次元非構造データ検索 / 大規模知識索引 / 知識発見 / ビッグデータ
Outline of Annual Research Achievements

本研究では,実世界と情報世界が融合した巨大な情報空間からの知識基盤形成のための次世代半構造マイニング技術の確立を目指す.
(1) 最適パターン発見を用いた超高速半構造マイニングエンジンの研究開発 (有村・宇野・平田)では,論理関数や時系列パターンのような意味論(semantics)の族に対して,種々の制約や最適化スコアを満たす規則集合を見つける離散構造列挙アルゴリズムを研究する. (2) 時空間情報を用いた半構造データマイニングの研究開発 (有村・宇野・平田・下薗) では,時間の半順序構造を有向非巡回グラフ構造で表すエピソード族のマイニングや,Earth Mover's Distance (EMD)を用いた木構造の近似照合手法を開発する. (3) 確率的情報スキーマと半構造データマイニングの結合の研究 (喜田・伊藤・有村) では,重要な半構造である関係データについて,ベイズモデリングに基づく無限関係モデルの効率良い学習アルゴリズムを研究する. (4) 大規模知識基盤形成システムのための知識連係技術の研究開発 (伊藤,平田,喜田,有村) では,知識連携の周辺技術として,高速検索を可能にする文法圧縮手法や,高次元空間における大規模近似検索手法、大規模ネットワークにおける疎な部分構造の列挙アルゴリズムを開発する. (5) 大規模知識基盤形成システムのための高速な知識索引技術の研究開発 (湊,宇野,有村) .ゼロサプレス二分決定グラフ (ZDD) 技術に基づいて大規模非構造データおよび発見されたパターンや規則をコンパクトに格納する知識索引の研究開発を行った. (6) 知識基盤形成支援システムのプロトタイプ構築 (全員) .開発した知識発見技術をプログラムとして実装し,理論解析および計算機実験による性能評価を行い,さらなる改善を行い,実世界知識基盤形成システムのプロトタイプを構築する.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

現在,研究は次の通り,おおむね順調に進展している:
(1) 頻出パターン列挙を用いずに,構造属性抽出と決定木構築を一体化しランダムフォレストを構築する手法を提案した(坂上他 JSAI2018).また前年度に開発した最適順序決定木計算手法ODTを拡張して,制約と最適スコアをもつルール解析を統一的に行う「決定木スケッチ」枠組みを検討した. (2) 菱形エピソードの族に対して,統計的優位性の降順にエピソードをランキングする効率良い手法を開発した(谷JSAI2018).木構造の部分族である根付きラベル付きキャタピラの近似照合手法を開発し,国際会議WCO2018でBest Paper Awardを受賞した(Muraka et al. WCO'18). (3) 関係データに対するベイズモデリングに基づく無限関係モデルの効率良い学習アルゴリズムを開発した(IEICE Trans. 2018). (4) 高次元空間における大規模近似検索手法(Sasaki et al. IEICE Trans)、高圧縮効率な文法圧縮手法(Furuya DCC2019)や,大規模ネットワークにおける疎な部分構造の列挙アルゴリズム(Kurita ISAAC2018, IWOCA2018),情報損失が少ないK匿名化アルゴリズムを開発した(Murakami et al. Int. J. Inf. Sec.). (5) ゼロサプレス二分決定グラフ (ZDD) 技術に基づいて大規模非構造データをコンパクトに格納する知識索引の研究を行った(Denzumi et al. Algorithms). (6) 開発した知識発見技術をプログラムとして実装し,理論および実験による性能評価を行い,さらなる改善を行う.開発したプログラムをツールとして逐次組み込んで,実世界からの知識基盤形成プラットフォームのプロトタイプを構築する.

Strategy for Future Research Activity

本研究では,半構造データから各種の「意味」を考慮した効率良い規則発見アルゴリズムを考察した.最近,人間中心人工知能技術の観点から,解釈性や,透明性,公平性の制約を満たす予測ルール発見が注目されている.(金森FPAI105,金森IBISML)のように)のように,本研究の成果をこれらの人間中心人工知能技術の各種の拡張学習問題に適用することは重要な課題である.そのために,これらの拡張学習問題を,制約と最適化スコアに分け,離散構造上の網羅的な最適化によって,良い解をみつける効率良いアルゴリズムを研究する必要がある.制約として,確率分布間のアースムーバーズ距離(輸送距離)のような統計的な意味を表す距離制約を考えることも重要である.もう一つの課題は,大規模なデータから人間にとって必要な情報を効率よく,俯瞰的に取り出す手法の研究である.超高速部分グラフ列挙アルゴリズム(Kurita ISAAC2018, IWOCA2018))や,データ研磨(Uno, A.I. Leaders Forum等)を用いたを用いた構造特徴抽出方法の半構造マイニングへの適用も重要な課題である.

  • Research Products

    (32 results)

All 2019 2018 Other

All Int'l Joint Research (2 results) Journal Article (16 results) (of which Int'l Joint Research: 2 results,  Peer Reviewed: 16 results) Presentation (14 results) (of which Int'l Joint Research: 3 results,  Invited: 5 results)

  • [Int'l Joint Research] University of Pisa(イタリア)

    • Country Name
      ITALY
    • Counterpart Institution
      University of Pisa
  • [Int'l Joint Research] MIT(米国)

    • Country Name
      U.S.A.
    • Counterpart Institution
      MIT
  • [Journal Article] "Efficient Approximate 3-Dimensional Point Set Matching Using Root-Mean-Square Deviation Score"2019

    • Author(s)
      Yoichi Sasaki, Tetsuo Shibuya, Kimihito Ito, and Hiroki Arimura
    • Journal Title

      IEICE Trans. Inf. and Syst., Special Section on Discrete Mathematics and Its Applications

      Volume: なし

    • Peer Reviewed
  • [Journal Article] Sequentially Swapping Colored Tokens on Graphs2019

    • Author(s)
      Katsuhisa Yamanaka, Erik D. Demaine, Takashi Horiyama, Akitoshi Kawamura, Shin-Ichi Nakano, Yoshio Okamoto, Toshiki Saitoh, Akira Suzuki, Ryuhei Uehara, Takeaki Uno
    • Journal Title

      J. Graph Algorithms, Appl.

      Volume: Vol.23, No.1 Pages: pp.3-27

    • Peer Reviewed / Int'l Joint Research
  • [Journal Article] Introducing Fluctuation into Increasing Order of Symmetric Uncertainty for Consistency-Based Feature Selection2019

    • Author(s)
      Sho Shimamura, Kouichi Hirata
    • Journal Title

      TAMC 2019

      Volume: なし Pages: pp.550-565

    • Peer Reviewed
  • [Journal Article] MR-RePair: Grammar Compression based on Maximal Repeats2019

    • Author(s)
      Isamu Furuya, Takuya Takagi, Yuto Nakashima, Shunsuke Inenaga, Hideo Bannai and Takuya Kida
    • Journal Title

      In Proceedings of Data Compression Conference (DCC2019)

      Volume: なし Pages: pp.508-517

    • Peer Reviewed
  • [Journal Article] DenseZDD: A Compact and Fast Index for Families of Sets2018

    • Author(s)
      Shuhei Denzumi, Jun Kawahara, Koji Tsuda, Hiroki Arimura, Shin-ichi Minato, and Kunihiko Sadakane
    • Journal Title

      Algorithms

      Volume: Vol.11, No.128

    • DOI

      doi:10.3390/a11080128

    • Peer Reviewed
  • [Journal Article] "Discovering Co-Cluster Structure from Relationships between Biased Objects"2018

    • Author(s)
      Iku Ohama, Takuya Kida, Hiroki Arimura
    • Journal Title

      IEICE Transactions

      Volume: Vol.101-D, No.12 Pages: pp.3108-3122

    • Peer Reviewed
  • [Journal Article] "Efficient Enumeration of Dominating Sets for Sparse Graphs"2018

    • Author(s)
      Kazuhiro Kurita, Kunihiro Wasa, Hiroki Arimura, and Takeaki Uno
    • Journal Title

      Proceedings of the 29th International Symposium on Algorithms and Computation (ISAAC 2018), Leibniz International Proceedings in Informatics (LIPIcs)

      Volume: Vol.8 Pages: pp.1-13

    • Peer Reviewed
  • [Journal Article] "Efficient Enumeration of Subgraphs and Induced Subgraphs with Bounded Girth"2018

    • Author(s)
      Kazuhiro Kurita, Kunihiro Wasa, Alessio Conte, Takeaki Uno, and Hiroki Arimura
    • Journal Title

      Proceedings of the 29th International Workshop on Combinatorial Algorithms (IWOCA 2018), Leibniz International Proceedings in Informatics (LIPIcs)

      Volume: Vol.10979 Pages: pp.201-213

    • Peer Reviewed / Int'l Joint Research
  • [Journal Article] Optimization algorithm for k-anonymization of datasets with low information loss2018

    • Author(s)
      Keisuke Murakami, Takeaki Uno
    • Journal Title

      Int. J. Inf. Sec.

      Volume: Vol.17, No.6 Pages: pp.631-644

    • Peer Reviewed
  • [Journal Article] Ladder-Lottery Realization2018

    • Author(s)
      Katsuhisa Yamanaka, Takashi Horiyama, Takeaki Uno, Kunihiro Wasa
    • Journal Title

      CCCG 2018

      Volume: なし Pages: pp.61-67

    • Peer Reviewed
  • [Journal Article] An Efficient Algorithm for Enumerating Induced Subgraphs with Bounded Degeneracy2018

    • Author(s)
      Kunihiro Wasa, Takeaki Uno
    • Journal Title

      COCOA 2018

      Volume: なし Pages: pp.35-45

    • Peer Reviewed
  • [Journal Article] Exact Algorithms for the Max-Min Dispersion Problem2018

    • Author(s)
      Toshihiro Akagi, Tetsuya Araki, Takashi Horiyama, Shin-Ichi Nakano, Yoshio Okamoto, Yota Otachi, Toshiki Saitoh, Ryuhei Uehara, Takeaki Uno, Kunihiro Wasa
    • Journal Title

      FAW 2018

      Volume: なし Pages: pp.263-272

    • Peer Reviewed
  • [Journal Article] Computational Complexity of Robot Arm Simulation Problems2018

    • Author(s)
      Tianfeng Feng, Takashi Horiyama, Yoshio Okamoto, Yota Otachi, Toshiki Saitoh, Takeaki Uno, Ryuhei Uehara
    • Journal Title

      IWOCA 2018

      Volume: なし Pages: pp.177-188

    • Peer Reviewed
  • [Journal Article] Path Histogram Distance for Rooted Labeled Caterpillars2018

    • Author(s)
      Taiga Kawaguchi, Takuya Yoshino, Kouichi Hirata
    • Journal Title

      ACIIDS 2018

      Volume: Vol.1 Pages: pp.276-286

    • Peer Reviewed
  • [Journal Article] Computing Edit Distance between Rooted Labeled Caterpillars2018

    • Author(s)
      Kohei Muraka, Takuya Yoshino, Kouichi Hirata
    • Journal Title

      the 11th Interntional Workshop on Computational Optimization (WCO'18), FedCSIS 2018 (Best Paper Award, 9 Sept. 2018)

      Volume: なし Pages: pp.249-255

    • Peer Reviewed
  • [Journal Article] LCA Histogram Distance for Rooted Labeled Caterpillars2018

    • Author(s)
      Takuya Yoshino, Kohei Muraka, Kouichi Hirata
    • Journal Title

      KDIR 2018

      Volume: なし Pages: pp.305-312

    • Peer Reviewed
  • [Presentation] "イベント系列からの有意なエピソードの効率良いマイニング"2019

    • Author(s)
      谷 陽太,平田 耕一,有村 博紀
    • Organizer
      第11回データ工学と情報マネジメントに関するフォーラム (DEIM2019)
  • [Presentation] "An Efficient Algorithm for Enumerating Chordal Bipartite Induced Subgraphs in Graphs"2019

    • Author(s)
      栗田 和宏, 和佐 州洋, 宇野 毅明,有村 博紀
    • Organizer
      第171回アルゴリズム研究会, 情報処理学会
  • [Presentation] "整数計画法に基づく学習済み決定木の公平性を考慮した編集法"2019

    • Author(s)
      金森 憲太朗,有村 博紀
    • Organizer
      第108回人工知能基本問題研究会(SIG-FPAI)
  • [Presentation] 少し目線を変えるだけでアルゴリズムはこんなに使いやすくなる2019

    • Author(s)
      宇野 毅明
    • Organizer
      日本ソーシャルデータサイエンス学会シンポジウム 2019年3月2日
    • Invited
  • [Presentation] 極大反復部分文字列に基づく文法圧縮2019

    • Author(s)
      古谷 勇,髙木 拓也,中島 祐人,稲永 俊介,坂内 英夫,喜田 拓也
    • Organizer
      第171回アルゴリズム研究会
  • [Presentation] データストリームに対する効率良い頻出アイテム発見アルゴリズム2019

    • Author(s)
      鳥谷部 直弥,喜田 拓也
    • Organizer
      第11回データ工学と情報マネジメントに関するフォーラム (DEIM2019)
  • [Presentation] "モデル選択のためのサポートベクトル列挙"2018

    • Author(s)
      金森 憲太朗, 原 聡, 石畠 正和, 有村 博紀
    • Organizer
      第29回情報論的学習理論と機械学習(IBISML)研究会
  • [Presentation] "イベント系列からの有意性を考慮した菱形エピソードマイニング"2018

    • Author(s)
      谷 陽太, 古谷 勇, 平田 耕一, 有村 博紀
    • Organizer
      2018度人工知能学会全国大会 (JSAI2018)
  • [Presentation] "グラフ断片決定木を用いたグラフ特徴抽出手法"2018

    • Author(s)
      坂上 陽規,瀧川 一学 ,有村 博紀
    • Organizer
      2018度人工知能学会全国大会 (JSAI2018)
  • [Presentation] New Approaches for Clustering Problems2018

    • Author(s)
      宇野 毅明
    • Organizer
      Asia-Pacific World Congress on Computer Science and Engineering 2018
    • Int'l Joint Research / Invited
  • [Presentation] New Approaches for Clustering Problems2018

    • Author(s)
      宇野 毅明
    • Organizer
      International Symposium on Computing and Networking 2018
    • Int'l Joint Research / Invited
  • [Presentation] 地方で AI を始めるには- AIから業務とビジネスを考える -2018

    • Author(s)
      宇野 毅明
    • Organizer
      AIフェスティバルin金沢 2018
    • Invited
  • [Presentation] The Importance of Interpretability the Rules of AI and Machine Learning2018

    • Author(s)
      宇野 毅明
    • Organizer
      A.I. Leaders Forum
    • Int'l Joint Research / Invited
  • [Presentation] データストリームに対する頻出値問題を解くアルゴリズムの実証実験2018

    • Author(s)
      鳥谷部 直弥,谷 陽太,喜田 拓也
    • Organizer
      第17回情報科学フォーラム (FIT2018)

URL: 

Published: 2019-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi