研究課題/領域番号 |
21K12018
|
研究機関 | 同志社大学 |
研究代表者 |
大崎 美穂 同志社大学, 理工学部, 教授 (30313927)
|
研究分担者 |
大西 圭 九州工業大学, 大学院情報工学研究院, 准教授 (30419618)
片桐 滋 同志社大学, 理工学部, 教授 (40396114)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
キーワード | 知識発見 / 非線形従属関係 / 共非線形性尺度 / 正則化 / ニューラルネットワーク / グループラッソ |
研究実績の概要 |
様々な分野において,対象問題が持つ変数間の複雑な従属関係を明らかにして知識獲得や予測に役立てることが望まれる.自動的に多種多様なデータを得られる現在では,既知の知識の積上げとは異なるデータ駆動型の問題解決アプローチにより,従属関係を導き出す汎用的な技術が必須であろう.本研究の最終目標は,このアプローチのもとに複数の変数間の非線形な従属関係(共非線形性と呼ぶ)を分析する手法の確立である.本分析手法の確立には,変数同士の共非線形性を検出する尺度と,その尺度を活用して非線形な従属関係にある変数の集合と代表を発見する手法が必要である.
そこで本年度,我々は前者の実現に向けて共非線形性尺度であるNNR-GLを提案した.NNR-GLは,ニューラルネットワークによる回帰(NNR)と入力層の各変数にL1正則化を施すグループラッソ(GL)の組合せ,および,回帰性能と変数の重みを統合して尺度値とする機能から成る.NNRが多変数間に存在する非線形な従属関係をモデル化するとともに,GLが従属関係の強さを重みに反映することで,共非線形性を検出できる.このNNR-GLのアイディアを形にすべく,定式化・アルゴリズム化,システム開発,評価実験を行った.結果として,NNR-GLが従来の尺度よりも検出性能が高いことが確認されたので,国際会議と学術論文で研究成果を発表した.今後は,本年度の研究成果に基づいてNNR-GLと新たな機能を融合させ,共非線形変数集合・代表発見手法であるNNR-GLIAに着手して行く.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本年度(2021年度)はNNRによる非線形モデル化とGLによる変数選択を融合し,非線形な従属関係を測り検出する尺度NNR-GLの実現に注力した.詳細に述べると次の通りである.2021年度前半では,NNR-GLを定式化・アルゴリズム化して,そのシステムを設計するとともに,評価実験に用いるデータを準備した.具体的には,既存の代表的な尺度であるMICの論文に書かれた人工データを合成し,正解の従属関係を付与した.また,UCIとKaggleで公開されている実データのうち,規模の異なる2種類の糖尿病検査データを入手し,医学文献の調査結果に基づいて正解を付与した.
2021年度後半では,年度前半に行ったシステム設計のもとにNNR-GLのソフトウェアを開発した.本開発ではNNR-GLに加えて,比較対象となる従来の尺度(相関係数,距離相関,他の非線形な尺度MICやHSIC),および,実験環境も実装して統合した.本システムを用いて,正解の従属関係付きの人工データと実データに各尺度を適用し,共非線形性の検出性能を比較評価した.その結果,NNR-GLが他の尺度よりも高い検出性能を持つことを確認できた.さらに年度末までに,国際会議での成果発表と学術論文の執筆・出版に至った.
|
今後の研究の推進方策 |
2021年度の研究によりNNR-GLの有効性が確認されたので,2022年度はNNR-GLを活用して,非線形な従属関係を持つ変数の集合と代表を発見する手法NNR-GLIAに着手する.2022年度前半では,NNR-GLIA(特に,複数のNNR-GLの実行結果を統合するIA機能)を定式化・アルゴリズム化し,そのシステムを設計して開発していく.さらに,NNR-GLIAで得た非線形な従属関係のモデルから明示的な関数を導出する手続きを考案し,システムに機能追加する.
2022年度後半では,2021年度に整備した評価用データに新たなデータを加え,これらを用いてNNR-GLIAの評価実験を行う.NNR-GLIAが再現性と解釈可能性を備えた形で,多変数間の非線形な従属関係を明らかにできるかを調べる.最後に2023年度の準備として,NNR-GLとNNR-GLIAの進化的最適化への応用を検討する.実応用に向けて,生活習慣病医療データの選定と入手も開始する見込みである.
|