2020 Fiscal Year Annual Research Report
Expansion of efficient search and discovery technology for processing massive data stream in the real world
Project/Area Number |
18K19771
|
Research Institution | Hokkaido University |
Principal Investigator |
有村 博紀 北海道大学, 情報科学研究院, 教授 (20222763)
|
Co-Investigator(Kenkyū-buntansha) |
トーマス ツォイクマン 北海道大学, 情報科学研究院, 教授 (60374609)
喜田 拓也 北海学園大学, 工学部, 教授 (70343316)
|
Project Period (FY) |
2018-06-29 – 2021-03-31
|
Keywords | ストリームデータ処理 / データマイニング / 情報検索 / 大規模知識処理 / 大規模並列列挙 / 文脈性 / 多重性 / 並列ソルバー |
Outline of Annual Research Achievements |
本申請課題では,多様で膨大な実世界時空間ストリームデータに対する高速大規模な知識処理の基盤となる超高速な検索・発見技術の研究開発を行った. (a)多様で膨大な実世界時空間ストリームデータから特徴的なパターンや規則性の超高速な検索・発見について,ストリームからの学習の理論的モデルである正データからの帰納推論において,第三者からの助言(advice)を導入した非一様な新しい学習可能性に必要な非一様度を明らかにした (Jain, Frank, Zeugmann, 2020).得られた予測モデルの説明可能性に関して,決定森を含む予測モデルクラスに対して,望ましい出力を与える入力を求める半実仮想説明の実効的な計算手法を開発した(Kanamori他 AAAI2021, IJCAI-PRICAI2020).さらに,決定森のクラスに対する出現頻度比に基づく変数重要度の計算方法を提案し,その有効性を実データで検証した(又他 JSAI2020). (b) 時空間ストリーム上の複雑な構造パターンに対する適応性・文脈性・低メモリ性・高速性をもつ検索・発見技術に関して,前年度までに開発した技術を元に次の成果を得た.多重ストリーム向け全オンライン接尾辞について,非巡回有向語グラフの同時構築手法を加えて,当該分野の論文誌(Takagi他 Algorithmica, 2020)で発表した.系列データからの統計的有意な菱形エピソードの発見について低メモリ性を考慮したビット並列手法を検討し,相互作用をもつ特徴選択スコアの計算に,先のビット並列ストリーム計数手法を適用するための検討をおこない,実験結果を発表した(王他 SIG-FPAI2021). (c)実世界情報からの知識獲得のためのアーキテクチャの研究開発について,上記で開発した各種アルゴリズムの実装,理論的・実証的解析を行ない,開発にフィードバックした.
|
Research Products
(13 results)