2018 Fiscal Year Annual Research Report
実世界知識基盤形成のための次世代半構造マイニング技術の研究
Project/Area Number |
16H01743
|
Research Institution | Hokkaido University |
Principal Investigator |
有村 博紀 北海道大学, 情報科学研究科, 教授 (20222763)
|
Co-Investigator(Kenkyū-buntansha) |
宇野 毅明 国立情報学研究所, 情報学プリンシプル研究系, 教授 (00302977)
湊 真一 京都大学, 情報学研究科, 教授 (10374612)
平田 耕一 九州工業大学, 大学院情報工学研究院, 教授 (20274558)
伊藤 公人 北海道大学, 人獣共通感染症リサーチセンター, 教授 (60396314)
下薗 真一 九州工業大学, 大学院情報工学研究院, 准教授 (70243988)
喜田 拓也 北海道大学, 情報科学研究科, 准教授 (70343316)
|
Project Period (FY) |
2016-04-01 – 2020-03-31
|
Keywords | 非構造データ / 意味マイニング / 時空間データマイニング / イベントストリーム処理 / 高次元非構造データ検索 / 大規模知識索引 / 知識発見 / ビッグデータ |
Outline of Annual Research Achievements |
本研究では,実世界と情報世界が融合した巨大な情報空間からの知識基盤形成のための次世代半構造マイニング技術の確立を目指す. (1) 最適パターン発見を用いた超高速半構造マイニングエンジンの研究開発 (有村・宇野・平田)では,論理関数や時系列パターンのような意味論(semantics)の族に対して,種々の制約や最適化スコアを満たす規則集合を見つける離散構造列挙アルゴリズムを研究する. (2) 時空間情報を用いた半構造データマイニングの研究開発 (有村・宇野・平田・下薗) では,時間の半順序構造を有向非巡回グラフ構造で表すエピソード族のマイニングや,Earth Mover's Distance (EMD)を用いた木構造の近似照合手法を開発する. (3) 確率的情報スキーマと半構造データマイニングの結合の研究 (喜田・伊藤・有村) では,重要な半構造である関係データについて,ベイズモデリングに基づく無限関係モデルの効率良い学習アルゴリズムを研究する. (4) 大規模知識基盤形成システムのための知識連係技術の研究開発 (伊藤,平田,喜田,有村) では,知識連携の周辺技術として,高速検索を可能にする文法圧縮手法や,高次元空間における大規模近似検索手法、大規模ネットワークにおける疎な部分構造の列挙アルゴリズムを開発する. (5) 大規模知識基盤形成システムのための高速な知識索引技術の研究開発 (湊,宇野,有村) .ゼロサプレス二分決定グラフ (ZDD) 技術に基づいて大規模非構造データおよび発見されたパターンや規則をコンパクトに格納する知識索引の研究開発を行った. (6) 知識基盤形成支援システムのプロトタイプ構築 (全員) .開発した知識発見技術をプログラムとして実装し,理論解析および計算機実験による性能評価を行い,さらなる改善を行い,実世界知識基盤形成システムのプロトタイプを構築する.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
現在,研究は次の通り,おおむね順調に進展している: (1) 頻出パターン列挙を用いずに,構造属性抽出と決定木構築を一体化しランダムフォレストを構築する手法を提案した(坂上他 JSAI2018).また前年度に開発した最適順序決定木計算手法ODTを拡張して,制約と最適スコアをもつルール解析を統一的に行う「決定木スケッチ」枠組みを検討した. (2) 菱形エピソードの族に対して,統計的優位性の降順にエピソードをランキングする効率良い手法を開発した(谷JSAI2018).木構造の部分族である根付きラベル付きキャタピラの近似照合手法を開発し,国際会議WCO2018でBest Paper Awardを受賞した(Muraka et al. WCO'18). (3) 関係データに対するベイズモデリングに基づく無限関係モデルの効率良い学習アルゴリズムを開発した(IEICE Trans. 2018). (4) 高次元空間における大規模近似検索手法(Sasaki et al. IEICE Trans)、高圧縮効率な文法圧縮手法(Furuya DCC2019)や,大規模ネットワークにおける疎な部分構造の列挙アルゴリズム(Kurita ISAAC2018, IWOCA2018),情報損失が少ないK匿名化アルゴリズムを開発した(Murakami et al. Int. J. Inf. Sec.). (5) ゼロサプレス二分決定グラフ (ZDD) 技術に基づいて大規模非構造データをコンパクトに格納する知識索引の研究を行った(Denzumi et al. Algorithms). (6) 開発した知識発見技術をプログラムとして実装し,理論および実験による性能評価を行い,さらなる改善を行う.開発したプログラムをツールとして逐次組み込んで,実世界からの知識基盤形成プラットフォームのプロトタイプを構築する.
|
Strategy for Future Research Activity |
本研究では,半構造データから各種の「意味」を考慮した効率良い規則発見アルゴリズムを考察した.最近,人間中心人工知能技術の観点から,解釈性や,透明性,公平性の制約を満たす予測ルール発見が注目されている.(金森FPAI105,金森IBISML)のように)のように,本研究の成果をこれらの人間中心人工知能技術の各種の拡張学習問題に適用することは重要な課題である.そのために,これらの拡張学習問題を,制約と最適化スコアに分け,離散構造上の網羅的な最適化によって,良い解をみつける効率良いアルゴリズムを研究する必要がある.制約として,確率分布間のアースムーバーズ距離(輸送距離)のような統計的な意味を表す距離制約を考えることも重要である.もう一つの課題は,大規模なデータから人間にとって必要な情報を効率よく,俯瞰的に取り出す手法の研究である.超高速部分グラフ列挙アルゴリズム(Kurita ISAAC2018, IWOCA2018))や,データ研磨(Uno, A.I. Leaders Forum等)を用いたを用いた構造特徴抽出方法の半構造マイニングへの適用も重要な課題である.
|
Research Products
(32 results)
-
-
-
-
[Journal Article] Sequentially Swapping Colored Tokens on Graphs2019
Author(s)
Katsuhisa Yamanaka, Erik D. Demaine, Takashi Horiyama, Akitoshi Kawamura, Shin-Ichi Nakano, Yoshio Okamoto, Toshiki Saitoh, Akira Suzuki, Ryuhei Uehara, Takeaki Uno
-
Journal Title
J. Graph Algorithms, Appl.
Volume: Vol.23, No.1
Pages: pp.3-27
Peer Reviewed / Int'l Joint Research
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-