2021 Fiscal Year Annual Research Report
Research on analysis of corporate behavior structure by machine learning
Project/Area Number |
20H01537
|
Research Institution | Gakushuin University |
Principal Investigator |
白田 由香利 学習院大学, 経済学部, 教授 (30337901)
|
Co-Investigator(Kenkyū-buntansha) |
永島 正康 立命館大学, 経営学部, 教授 (20745202)
吉浦 裕 京都橘大学, 工学部, 教授 (40361828)
山口 健二 お茶の水女子大学, サイエンス&エデュケーションセンター, 特任講師 (50582285)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Keywords | 機械学習 / 回帰分析 / Shapley値 / SHAPアプローチ / 特性関数 / 企業分析 / 回帰分析の可視化 |
Outline of Annual Research Achievements |
株価安定期の日本製造業3業種を分析し、株価上昇には売上成長率、在庫回転率及び有形固定資産回転率が重要であることを検証した。次に世界自動車製造業及び電気機器製造業で回帰分析を行い、株価上昇率のための重要要素を回帰により求めた。株価大暴落後の2018年3月1日から4月20日までの株価回復率をターゲット変数とし、生の説明変数値とターゲット値では相関関係が出ないが、各説明変数のSHAP値とターゲット値では高い相関性が得られた。さらに多重共線性の影響を排除するため、各説明変数SHAP値を主成分分析により次元圧縮を行った。この結果、自動車ケースでは、主成分1として収益及びROE等の利益性要素が得られ、主成分2として在庫及び固定資産回転率等のサプライチェーン(SC)的要素が得られた。電気機器のケースにおいては主成分1に利益性要素とSC的要素、さらに売上高成長率が現れ、主成分2はROAと売上高成長率であった。従来から株価回復率にROE等の収益性に関する変数が重要な影響を与えていることは知られていたが、今回SHAPアプローチにより初めて株価回復へのSC的説明変数の重要性が検証された。SHAPは、特性関数を用いることで各企業の特性に基づく説明変数貢献度の評価を可能とする。従来の絶対値による説明変数の評価法と異なり、その企業なりの特性を踏まえた上で、各説明変数のターゲット変数への影響を評価可能とした。SHAPアプローチは経営学だけではなく人文科学及び医学等、回帰を用いる全分野で活用可能である。白田は、SHAPアプローチ普及のため学会でチュートリアル「機械学習回帰における Shapley 値の理論説明と事例紹介」を行った。事例として企業行動特性分析及び、日本の県別出生率の回帰の事例を用いた。SHAPの理論の可視化による説明が好評で、3月1日の録画公開後5月3日現在動画再生回数は284回を記録した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究の第1の目的は、機械学習における説明変数の重要度の測度の改善を図ることである。データ工学の分野のサーベイからSHAPという測度を知り、企業分析に適応し、その有効性を検証することができた。成果論文も発表した。また、各種の製造業における企業分析を行うことで、我々自身もSHAPの理論を深く理解することができた。また、SHAPによる分析結果を多数可視化したことで、それを教材として回帰分析結果をさらに分かりやすく説明可能となった。2022年2月27日のDEIMチュートリアル「機械学習回帰における Shapley 値の理論説明と事例紹介」で多くの日本若手研究者にSHAPアプローチを広めることができたことで、第1の目的は達成できたと考える。
|
Strategy for Future Research Activity |
2022年度の計画としては (A)Amplitude-based 時系列データクラスタリング手法の開発:企業の株価上昇率及びパターンの比較を行ないたい。その株価変動のクラスタリングのためには株価を標準化しないままで扱う手法が必要であるが、その手法はまだ確立されていない。クラスタリングのアルゴリズム自体の改良を行う。 (B)Shapley値による樹形図描画:回帰では樹形図を説明変数の生のデータで描く。これをShapley値を使って描くことで説明変数の重要性を別の視点から解析する。 (C)Shapley値の時系列変化分析:説明変数の経営指標として過去10年平均値を用いることは昨年度と同じであるが、被説明変数が時系列する場合、各説明変数のShapley値がどのように時系列変化するかを分析する。 得られた結果を可視化表現して取りまとめ学会発表する。
|
Remarks |
DEIMチュートリアル動画は、情報処理学会DBS研究会などの主催者が掲載してくれた。筆者たちが自分で行ったものではない。
|
Research Products
(15 results)