本研究においては「人間本位の機械学習の基盤技術として識別パターン発見技術を確立する」という目標に対し,副目標1: 医療データに対して ECHO 法が出力する識別パターンに対する解釈・説明可能性の検証,副目標2: ECHO 法における動的優先付け探索の洗練と実行監視ツールの開発,副目標3: メニーコア CPU における ECHO 法のメモリ共有型並列化,副目標4: ECHO 法が出力する識別パターンを利用した高い予測性能を持つ連関分類器の開発,といった4つの副目標を設定している.
副目標1では,診療報酬明細書データからの薬剤起因性老年症候群の発症予測モデル(勾配ブースティング木に基づく)を構築し(第36回人工知能学会全国大会),その際に因果の逆転が起こっていること(治療薬が発症予測モデルの判断根拠に含まれる)をECHO法に基づき確認した.識別パターンが機械学習モデルの誤り分析に利用できるとの知見を得た.slice findingと呼ばれる手法との共通性が見られる.副目標2については大きな進捗はなかった.副目標3では,近年注目されるRust言語を用いて識別パターン発見アルゴリズムであるRP-growth法をメモリ共有方式で並列実装する手法を第15回データ工学と情報マネジメントに関するフォーラムにて発表した.また,副目標4については,前年度に続いて連関分類器に関する研究論文を準備している.更に,本研究課題を包含する説明可能 (explainable) AI 分野について,前年度発表した調査論文を拡大した内容の論文を電子情報通信学会基礎・境界ソサイエティ Fundamentals Review で発表している.
研究期間全体を通じては副目標1~4に関して一定の研究成果が得られ,識別パターン発見技術が人間本位の機械学習基盤となり得ることを示すことができたと言える.
|