• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

高次元ブール値テンソルデータからの多項閉集合を用いた知識発見

研究課題

研究課題/領域番号 21H03499
研究種目

基盤研究(B)

配分区分補助金
応募区分一般
審査区分 小区分61030:知能情報学関連
研究機関京都大学

研究代表者

山本 章博  京都大学, 情報学研究科, 教授 (30230535)

研究分担者 小林 靖明  京都大学, 情報学研究科, 助教 (60735083)
研究期間 (年度) 2021-04-01 – 2024-03-31
研究課題ステータス 交付 (2023年度)
配分額 *注記
15,730千円 (直接経費: 12,100千円、間接経費: 3,630千円)
2023年度: 4,940千円 (直接経費: 3,800千円、間接経費: 1,140千円)
2022年度: 4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円)
2021年度: 6,110千円 (直接経費: 4,700千円、間接経費: 1,410千円)
キーワードデータマイニング / 高次元ブール値データ / 閉集合 / 列挙アルゴリズム
研究開始時の研究の概要

以下の3つの課題を設定する.
課題1.多項閉集合の新たな数学的性質を解明する.研究代表者以外の国外グループが進めてきた束論的・代数的な性質の分析ではなく,関係データの主要演算である「自然結合」を考慮し,さらにノイズや誤差を考慮した弱閉集合を基礎にした新たな数学的理論を構築する.
課題2.2項閉集合の列挙アルゴリズムを利用しながら多項閉集合を効率的に列挙するアルゴリズムを構成する.
課題3.実データを用いて,多項閉集合列挙の有用性を検証し,アルゴリズムの改善を行う.また頻出2項閉集合が持つデータ圧縮としての性質を多項閉集合も持つかどうかを検証しする.必要に応じて課題1・課題2にフィードバックする.

研究実績の概要

本年度はまず課題2(多項閉集合の高速列挙)に取り組んだ.基本方針は,2次元ブール値データから2項閉集合を生成し列挙するアルゴリズムを利用しながら,高次元ブール値データから多項閉集合を列挙するアルゴリズムを設計し,プログラムとしての実装を行う,というものである.2項閉集合は組合せ集合を列挙ためのアルゴリズムであるZDDを利用して実装できることが知られている.さらにZDDは集合間の演算を高速に計算できるため,本研究ではZDDを利用することとした.また本年度は3次元ブール値データを対象とした.開発した列挙アルゴリズムはZ-TCAと名付けている.
2項閉集合を生成し列挙するためには,2項閉集合が集合から集合へ定義された2つの写像をを合成した写像の不動点になるという性質を用いる.このれらの写像を2次元以上に拡張することは可能ではあるが,多項閉集合が不動点と一致するという便利な性質は備えていないものの,次元を1次元ずつ減少させることにより2項閉集合の列挙に還元できる,という性質がある.集合から集合への写像は集合の演算として表現できるため,ZDDを用いれば多項閉集合の生成と列挙が高速化可能となる.この集合演算のZDDによる実装を設計し,従来研究で提案されていた「逐次的な次元数削減と集合間演算によるアルゴリズム」の実装に適用した結果,素朴な集合演算の実装を利用した場合に比して,実データを用いた計算機実験において3倍の高速化が達成された.
さらに課題3にも取り組んだ.年度当初の計画では,生命システム機能分析のためのデータセット集積体であるKEGGデータベース中のデータセットを使う予定であったが,この研究に利用するには大規模なフォーマット変換が必要であることから断念し,Wikipediaから生成された知識グラフを利用することとし,知識グラフから有用な3項閉集合を抽出する実験を行った.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

課題2の研究成果は,国内研究会で論文として発表済みである.さらに当該論文を発展させて,英語論文として学術雑誌に投稿中である.課題3の研究成果についても,KEGGデータセベースを利用するという計画は断念せざるを得なかったが,別の目的で利用していた知識グラフが3次元ブール値データとみなすことができ,3項閉集合のマイニング対象として有望であることが判明し,実際にマイニングを行った.

今後の研究の推進方策

来年度は主に課題3に取り組む.知識グラフからの3項閉集合のマイニングについては論文投稿を目指すとともに,XAIとしても意味を持つのではないかと予想しており,さらなる展開を目指すまたのマイニング対象する3次元ブール値データとして,生命科学分野で用いられるデータセットで大きなフォーマット変化を要しないものが見つかったので,計算機実験を行いながら,課題1,2の結果へのフィードバックも検討する.

報告書

(2件)
  • 2022 実績報告書
  • 2021 実績報告書
  • 研究成果

    (5件)

すべて 2023 2022 2021

すべて 雑誌論文 (4件) (うち査読あり 1件) 学会発表 (1件)

  • [雑誌論文] 類似度指標のラベル付き有向グラフへの拡張2022

    • 著者名/発表者名
      松原 徳秀, 山本 章博
    • 雑誌名

      人工知能学会研究会資料 人工知能基本問題研究会

      巻: 121 号: 0 ページ: 24-29

    • DOI

      10.11517/jsaifpai.121.0_24

    • ISSN
      2436-4584
    • 年月日
      2022-09-12
    • 関連する報告書
      2022 実績報告書
  • [雑誌論文] Event Time Extraction from Japanese News Archives2022

    • 著者名/発表者名
      Siqi Peng, Akihiro Yamamoto, Shinsuke Mori, Tatsuki Sekino
    • 雑誌名

      Proceedings of 2022 IEEE International Conference on Big Data (Big Data)

      巻: - ページ: 2556-2564

    • DOI

      10.1109/bigdata55660.2022.10020243

    • 関連する報告書
      2022 実績報告書
    • 査読あり
  • [雑誌論文] Concept Lattice Reduction Using Integer Programming2021

    • 著者名/発表者名
      Siqi Peng and Akihiro Yamamoto
    • 雑誌名

      人工知能学会 知識ベースシステム研究会

      巻: SIG-KBS 123

    • DOI

      10.21203/rs.3.rs-1691428/v1

    • NAID

      130008076855

    • 関連する報告書
      2021 実績報告書
  • [雑誌論文] Applying ZBDD for Triadic Concept Analysis2021

    • 著者名/発表者名
      Siqi Peng and Akihiro Yamamoto
    • 雑誌名

      人工知能学会 人工知能基本問題研究会

      巻: SIG-FPAI 116 ページ: 8-13

    • 関連する報告書
      2021 実績報告書
  • [学会発表] 知識グラフを用いた多肢選択問題に対する選択肢と根拠の生成方法2023

    • 著者名/発表者名
      植松温大,山本章博,市瀬夏洋
    • 学会等名
      日本ソフトウェア科学会 ネットワークが創発する知能研究会
    • 関連する報告書
      2022 実績報告書

URL: 

公開日: 2021-04-28   更新日: 2023-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi