2021 Fiscal Year Annual Research Report
Robust AI by Integration of Knowledge Representation and Machine Learning
Project/Area Number |
21H04905
|
Research Institution | National Institute of Informatics |
Principal Investigator |
井上 克巳 国立情報学研究所, 情報学プリンシプル研究系, 教授 (10252321)
|
Co-Investigator(Kenkyū-buntansha) |
坂間 千秋 和歌山大学, システム工学部, 教授 (20273873)
Nicolas Schwind 国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (60646397)
小島 諒介 京都大学, 医学研究科, 講師 (70807651)
|
Project Period (FY) |
2021-04-05 – 2025-03-31
|
Keywords | 知識表現・推論 / 機械学習 / ロバストAI |
Outline of Annual Research Achievements |
本研究では、機械学習(ML)と知識表現・推論(KR)の両技術を有機的に統合することで、説明可能でありロバスト性も有するような次世代AIのための技術基盤を確立する。このために、(A)KR技術の導入によるML技術の説明可能性・更新容易性の向上、(B)ML技術に支えられたロバストなKR技術の開発、(C)MLとKRの統合による画期的なAI応用、という研究目標を設定している。2021年度では、以下の進捗があった。 (A)決定木アンサンブルからの規則抽出において解集合プログラミングを用いることで、制約に応じて有用な説明規則を生成する手法を開発した。また分類器の修正を合理性の観点から遂行するために、KRの信念修正で研究されてきた合理的基準を設定し、分類器「編集」オペレータに対する構成的特徴付けを与え、基準を満たす編集オペレータの族について調べた。さらに、画像データを述語表現に変換し帰納推論を適用することで解釈可能な表現学習を実現し、分類実験において90%前後の正解率が得られた。 (B)SAT問題を行列表現し、線形空間におけるコスト関数最小化問題として定式化することによりSAT問題の解を求める方式を開発・実装した。行列計算に基づくためGPUなどの並列計算テクノロジーと親和性が高く、30万変数規模のランダム3-SAT問題で既存SLSタイプのSATソルバーを凌ぐ計算速度を持つことを確認した。また、解釈遷移からの学習(LFIT)の微分可能化とニューラルネットワーク上での実装・ロバスト化を行った。 (C)論理式などの記号的知識表現と画像や数値データなどの連続データ分析を組み合わせた手法として、テンソル意味論をベースにした手法の開発を行った。また、深層論理プログラミング言語T-PRISMの応用先の調査および簡易的な実験を行った。他の生物学応用として、新型コロナウイルスの生体内感染動態の解析に着手した。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
本研究は順調に進展しており、当初の計画で具体化できていなかった技術の開発も進んでいる。(A)「KR技術の導入によるML技術の説明可能性・更新容易性の向上」では、複数の手法を用いてML技術の説明可能性を向上させるための研究に取り組んでいる。現在は決定木アンサンブルと分類器を対象としているが、一般に任意のMLについて入出力を与えてモデルを学習する際にモデルを更新する問題に拡張できるものと考えられる。(B)「ML技術に支えられたロバストなKR技術の開発」においては、記号で表現されてきた各種推論・学習問題を、線形代数手法とニューラルネットワーク手法を用いて定式化し、さらに実装も進んでいるため、GPU等の高性能計算に基づくスケーラブルな推論・学習手法としての計算基盤を確立しつつある。(C)「MLとKRの統合による画期的なAI応用」では、ニューロ・シンボリックAIの基礎となる技術を生物医学や社会学分野に適用しており、そこから(A)(B)各種技術へのフィードバックも生じてきている。
|
Strategy for Future Research Activity |
記号処理を伴う問題はこれまで離散化された値を取り得る変数の組合せで表現され、その表現に基づく論理推論や帰納論理プログラミング技術が開発されてきた。これら従来の記号的AIによる学習は説明可能性を有しているが、ノイズに弱いため実ドメインから得られるデータを表現する際にエラーが起こると推論結果も間違ったものとなっていた。本研究では、こうした推論・学習問題を代数的手法と連続ドメインにおける最適化手法を用いて解くという新技術(サブテーマB)をいくつも開発している。今後はSAT・帰納論理プログラミングに限らず、ブーリアンネットワークや論理プログラム計算、アブダクション等の推論技術にも適用し、ロバストでスケーラブルな推論基盤技術を確立したい。また連続領域における現実問題において推論するために、従来のように連続データを離散化により記号化するようなことをせず、連続値のまま扱うことで推論する技術を開発する。さらにこうした連続領域での論理プログラミング技術として一般化し、こうした連続プログラムの学習にも取り組む。このために微分方程式系との関連も考えなければならない。その際に、従来KRで研究されてきた信念修正・更新等の技術を新たなML技術に適用し(サブテーマA)、説明・解釈可能性は担保したい。こうした新しい推論・学習技術を用いれば、科学分野や社会学分野における多くの挑戦的問題が解けるようになることも期待できる(サブテーマC)。
|
Remarks |
受賞1件: “Best Paper Award, ILP 2020-2021”, The 30th International Conference on Inductive Logic Programming, [論文: Tony Ribeiro et al., Machine Learnig, 2021 に対する受賞]
|
Research Products
(17 results)