複数の異なる人工知能モデルの知識拡張に向けた連携システムの開発

Research Project

Project/Area Number	23K16957
Research Category	Grant-in-Aid for Early-Career Scientists
Allocation Type	Multi-year Fund
Review Section	Basic Section 61030:Intelligent informatics-related
Research Institution	University of the Ryukyus
Principal Investigator	上原和樹琉球大学, 国際地域創造学部, 准教授 (50893864)
Project Period (FY)	2023-04-01 – 2026-03-31
Project Status	Granted (Fiscal Year 2023)
Budget Amount *help	¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000) Fiscal Year 2025: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000) Fiscal Year 2024: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000) Fiscal Year 2023: ¥1,690,000 (Direct Cost: ¥1,300,000、Indirect Cost: ¥390,000)
Keywords	深層学習 / 不確実情報 / マルチラベル分類 / 画像認識 / 人工知能 / 判断基準のゆらぎ / ニューラルネットワーク
Outline of Research at the Start	人工知能(AI)モデルの適切な学習や評価には、一貫した正解情報が付与されたデータセットが重要となるが、医療など熟練の知識や技術を要する分野では、データに対して一意に正解を与えることが困難な場合がある。本研究では、正解を定めることが困難な状況においても、適切な判定や学習ができるAIシステムについて研究する。具体的には、複数の異なる仕組みで学習した多様なAIモデルの知識を連携させ、認識課題における本質的な情報を抽出する技術を開発する。異なる仕組みで学習したAIは、異なる着眼点を持っていると考えられ、それらの関係性から各AIの知識を拡張させ、システム全体を最適化できる技術の実現を目指す。
Outline of Annual Research Achievements	本研究では、不確実情報を含む画像データセットから、認識課題において本質的な情報を得るために、複数の異なるデータや学習方法で構築されたAIモデルがそれぞれ学習した判断基準を「知識」として抽出し、それら知識の相関や相違といった関係性から不確実な情報の要因を特定し、さらにそれらの情報からAIシステムを最適化できる技術の開発を目的とする。そのために、2023年度は(1)複数の画像認識モデルの構築と(2)知識抽出および変換技術の開発に取り組んだ。まず、(1)複数の画像認識モデルを構築するため、不確実情報を含むデータセットとしてマルチラベル分類のベンチマークとして利用されるMSCOCOを活用した。不確実情報を様々な側面から捉えるため、畳み込みニューラルネットワークをベースとしたResNet50やTransformerをベースとしたSwinTranformerなどの異なるアーキテクチャを採用し、対照学習やMaskedAutoEncoderなどの自己教師あり学習を事前学習した画像認識モデルを構築し、MSCOCOのデータセットで再学習させた。 (2)のAIモデルからの知識抽出に向けた取り組みとして、複数のAIモデルの知識統合手法として考案したアンサンブル知識蒸留に、前述のマルチラベル分類学習を導入したHuKED（Human Knowledge Ensemble Distillation）を開発した。本手法と従来手法（アンサンブル学習、マルチラベル学習、多数決による推論）を単純に適用した場合とで比較したところ、提案手法は従来手法を上回る認識精度であることを確認できた。
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason 本研究の目的は、複数の異なるデータや学習方法で構築されたAIモデルから不確実な情報の要因を特定し、さらにそれらの情報を踏まえてAIシステムを最適化できる技術を開発することである。そのための研究項目として、(1)ベースとなる複数の画像認識モデルの構築、(2)AIモデルからの知識抽出技術の開発、(3)不確実情報推定技術の開発、(4)再学習機構の開発、(5)実データによる検証の5つが挙げられる。今年度は、(1)のベースとなる複数の画像認識モデルの構築と(2)の知識抽出技術の開発に取り組み、マルチラベル分類のための学習手法が、不確実情報を含むデータセットからのモデル構築に有効であることがわかり、発表に至る成果を得たことからおおむね順調であると評価した。
Strategy for Future Research Activity	2024年度は、おもに不確実情報推定技術と再学習機構の開発に取り組む。2023年度の研究において考案した学習手法（HuKED）は、不確実情報を含むデータセットから高精度な画像認識モデルを構築可能としたことを踏まえ、構築されたモデルを活用して学習用データセットを再評価することで、データラベルのノイズや一貫性といった不確実情報の推定に寄与する情報が得られると考えられる。このような不確実情報をもとに、AIモデルの再学習を加速させる手法を研究する。また、当初計画したとおり、不確実情報を含んだデータセットの収集や構築、それらのデータセットからの多様なAIモデルの構築は、2024年度以降も継続して取り組む。