• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

Study of index construction and compression algorithms in fully-online setting

Research Project

Project/Area Number 21K17817
Research Category

Grant-in-Aid for Early-Career Scientists

Allocation TypeMulti-year Fund
Review Section Basic Section 61030:Intelligent informatics-related
Research InstitutionFujitsu Limited (Fujitsu Research)

Principal Investigator

高木 拓也  富士通株式会社(富士通研究所), その他部局等, 研究員 (20855449)

Project Period (FY) 2021-04-01 – 2025-03-31
Project Status Granted (Fiscal Year 2023)
Budget Amount *help
¥4,030,000 (Direct Cost: ¥3,100,000、Indirect Cost: ¥930,000)
Fiscal Year 2024: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2023: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
Fiscal Year 2022: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2021: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Keywords文字列情報学 / 羅生門集合 / 圧縮索引 / 説明可能性 / 全文索引 / オンライン索引 / 接尾辞木 / 圧縮アルゴリズム / 完全オンライン索引
Outline of Research at the Start

ネットワークとセンサー技術の発展により,あらゆる場所に設置された情報源から日々膨大なデータ(ストリームデータ)が生み出され続けている.これらはデータの一次元的連結である文字列として扱うことができる.そこで本研究では,複数のストリームからデータが逐次的に集約される「マルチストリームデータ」を効率よく処理するための文字列索引・文字列圧縮技術・その他文字列アルゴリズムの開発を行う.完全オンラインと呼ばれるマルチストリーム下を想定した問題設定において新たな文字列アルゴリズム,特に完全オンライン圧縮文字列索引を開発することを目標にし,膨大なマルチストリームデータの効率の良い処理を実現する.

Outline of Annual Research Achievements

本研究は,様々な文字列情報学における問題に対し「どのようにすれば完全オンラインへの拡張が可能か?」を明らかにすることを目標としている.特に,(i)文脈性 (ii)完全オンライン性 (iii) 低メモリ性をもつ索引,すなわち「完全オンライン圧縮文字列索引」の構築を目指している .これを実現するためには,圧縮索引の通常オンライン構築アルゴリズムの開発と,その完全オンライン化の二つのステップが必要である.
2023年度は昨年度開発した決定木モデルに対する『羅生門集合』構築アルゴリズムの実装とその応用に注力した.羅生門集合とは最適決定木とほとんど同じ精度を持つ決定木の集合である.これには本研究の圧縮索引構造のアイデアを用いることで成功した.羅生門集合に関してはメディア取材や招待講演を行うことができた.また,この決定木に着目し,予測モデルの補正を決定木で行うことで説明可能性を担保する技術を開発し国際会議で発表した.これにより予測モデルの更新箇所を説明可能なモデルが得られた.また決定木で分類された属性ごとに,予測モデルの予測値を所望の値に変更する摂動を計算する技術の開発に成功し発表した.また昨年度に引き続き,東北大学のDiptarama Hendrian助教授・九州大学の稲永俊介教授らの協力のもと,線形サイズ接尾辞木(Linear-size Suffix Tree)に対して,文字列の末尾が伸長する場合と先頭が伸長する場合のオンライン構築アルゴリズムの具体的な手法を与えることに成功した.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

2023年度は線形サイズ接尾辞木に対するオンライン構築アルゴリズムを与えた一方で,計画にあったCDWAGに関する問題解決が想定よりも進まなかった.
しかし昨年度に引き続き機械学習分野における応用成果が得られ,国際会議における発表を実現できた.特に昨年度の主な成果である羅生門集合構築で扱った決定木に着目し,あらたな応用技術の成果を得ることができた.

Strategy for Future Research Activity

まず羅生門集合の構築手法をほかの機械学習モデルに発展させることを考えたい.今年度は構造方程式を表現する因果グラフに着目した羅生門構築アルゴリズムを開発したが,対外発表まで至らなかった.まずこの技術を完成させ,国際会議等で発表したい.また,今年度解決できなかった圧縮索引化が可能なCDAWGと呼ばれる索引構造の完全オンライン構築アルゴリズムを開発したい.具体的には,CDAWGは接尾辞木を同値類的観点からコンパクトに表現したものであるため,接尾辞木の完全オンライン構築アルゴリズムを実現する際に用いたDAWGとの並列構築手法をCDAWGにも適用することを考えたい.

Report

(3 results)
  • 2023 Research-status Report
  • 2022 Research-status Report
  • 2021 Research-status Report
  • Research Products

    (9 results)

All 2023 2022 2021

All Journal Article (3 results) (of which Peer Reviewed: 1 results,  Open Access: 1 results) Presentation (6 results) (of which Int'l Joint Research: 5 results,  Invited: 1 results)

  • [Journal Article] Mathematical Optimization for Explainable Machine Learning—Counterfactual Explanation by Mixed-Integer Linear Optimization—2023

    • Author(s)
      金森 憲太朗、高木 拓也
    • Journal Title

      Bulletin of the Japan Society for Industrial and Applied Mathematics

      Volume: 33 Issue: 4 Pages: 207-212

    • DOI

      10.11540/bjsiam.33.4_207

    • ISSN
      2432-1982
    • Year and Date
      2023-12-25
    • Related Report
      2023 Research-status Report
  • [Journal Article] Rule Mining for Correcting Classification Models2023

    • Author(s)
      Suzuki Hirofumi、Iwashita Hiroaki、Takagi Takuya、Fujishige Yuta、Hara Satoshi
    • Journal Title

      2023 IEEE International Conference on Data Mining (ICDM)

      Volume: 1 Pages: 1331-1336

    • DOI

      10.1109/icdm58522.2023.00170

    • Related Report
      2023 Research-status Report
  • [Journal Article] Distribution-Aware Counterfactual Explanation by Mixed-Integer Linear Optimization2021

    • Author(s)
      Kanamori Kentaro、Takagi Takuya、Kobayashi Ken、Arimura Hiroki
    • Journal Title

      Transactions of the Japanese Society for Artificial Intelligence

      Volume: 36 Issue: 6 Pages: C-L44_1-12

    • DOI

      10.1527/tjsai.36-6_C-L44

    • NAID

      130008110420

    • ISSN
      1346-0714, 1346-8030
    • Year and Date
      2021-11-01
    • Related Report
      2021 Research-status Report
    • Peer Reviewed / Open Access
  • [Presentation] Exploring the Whole Rashomon Set of Sparse Decision Trees2022

    • Author(s)
      Rui Xin, Chudi Zhong, Zhi Chen, Takuya Takagi, Margo Seltzer, Cynthia Rudin
    • Organizer
      NeurIPS 2022
    • Related Report
      2022 Research-status Report
    • Int'l Joint Research
  • [Presentation] A Multivariate Causal Discovery based on Post-Nonlinear Model2022

    • Author(s)
      Kento Uemura, Takuya Takagi, Kambayashi Takayuki, Hiroyuki Yoshida, Shohei Shimizu
    • Organizer
      CLeaR 2022
    • Related Report
      2022 Research-status Report
    • Int'l Joint Research
  • [Presentation] 機械学習モデルの列挙と羅生門集合の構築2022

    • Author(s)
      高木拓也
    • Organizer
      人工知能学会 第123回人工知能基本問題研究会
    • Related Report
      2022 Research-status Report
    • Invited
  • [Presentation] Counterfactual Explanation Trees: Transparent and Consistent Actionable Recourse with Decision Trees2022

    • Author(s)
      Kentaro Kanamori, Takuya Takagi, Ken Kobayashi, Yuichi Ike
    • Organizer
      AISTATS 2022
    • Related Report
      2021 Research-status Report
    • Int'l Joint Research
  • [Presentation] Explainable and Local Correction of Classification Models Using Decision Trees2022

    • Author(s)
      Hirofumi Suzuki, Hiroaki Iwashita, Takuya Takagi, Keisuke Goto, Yuta Fujishige, Satoshi Hara
    • Organizer
      AAAI 2022
    • Related Report
      2021 Research-status Report
    • Int'l Joint Research
  • [Presentation] Ordered Counterfactual Explanation by Mixed-Integer Linear Optimization2021

    • Author(s)
      Kentaro Kanamori, Takuya Takagi, Ken Kobayashi, Yuichi Ike, Kento Uemura, Hiroki Arimura
    • Organizer
      AAAI 2021
    • Related Report
      2021 Research-status Report
    • Int'l Joint Research

URL: 

Published: 2021-04-28   Modified: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi