ランダムフォレストにおける変数重要度の質改善方法の開発とその応用
Project/Area Number |
22K12193
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 61040:Soft computing-related
|
Research Institution | Tottori University |
Principal Investigator |
木村 周平 鳥取大学, 工学研究科, 教授 (20342777)
|
Project Period (FY) |
2022-04-01 – 2026-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥2,860,000 (Direct Cost: ¥2,200,000、Indirect Cost: ¥660,000)
Fiscal Year 2025: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
Fiscal Year 2024: ¥650,000 (Direct Cost: ¥500,000、Indirect Cost: ¥150,000)
Fiscal Year 2023: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
Fiscal Year 2022: ¥390,000 (Direct Cost: ¥300,000、Indirect Cost: ¥90,000)
|
Keywords | ランダムフォレスト / 変数重要度 / 遺伝子ネットワーク同定 / 重み付け |
Outline of Research at the Start |
研究代表者は回帰問題において学習データ内に似た事例が多数含まれる場合に,少なくとも変数重要度の観点においてランダムフォレストの性能が悪くなるという,これまでに知られていない現象を発見した.本研究ではまず,この性能悪化の原因・悪化する性能の範囲を明らかにする.次に,明らかにした原因を参考に,性能悪化への汎用的な対処方法の開発を行う.これによりランダムフォレストの性能悪化を防ぎ,利便性の向上を目指す.最後に,開発した性能悪化対処法を研究代表者が過去に開発したランダムフォレストのアプリケーション,並びにこれから開発する予定のランダムフォレストのアプリケーションへ適用することで,その有用性を実証する.
|
Outline of Annual Research Achievements |
本研究は人工知能技術の一種であるランダムフォレストにおいて,偏りのある学習データを与えて学習させたときに,変数重要度の質が大きく悪化する原因について調査するとともに,その性能悪化を回避するための方法を模索するものである. 本年度も前年度に引き続き,ランダムフォレストの変数重要度に関する性能が悪化するような学習データの偏りに関する調査を行った.その結果,学習データに似た事例が1点に大量に含まれる場合だけでなく,直線上に偏って事例が存在する場合や,高次元部分空間に偏って存在する場合にも,ランダムフォレストの変数重要度の質が悪化することを示した.前年度の研究において,訓練事例に適切な重み付けを行うことで変数重要度の質悪化が回避できることを示している.この研究は実問題を通してのみの研究であったが,一般の問題においても多くの場合,訓練事例に適切な重み付けを行うことで,変数重要度の質の悪化が回避できることを実験的に明らかにした.このことに関しては令和6年度に学会発表が決まっている.前述の実験では訓練事例が高次元部分空間に偏って存在する場合には,重み付け手法による変数重要度の質悪化が回避できないことが分かっている.そのような状況は実問題において起こりにくいと考えるが,そのような場合にも質悪化を回避する方法を模索したい. 他方,重み付け手法の適用として新たな遺伝子ネットワーク同定法の開発を行った.これまでの方法と異なり,シングルセルデータから遺伝子ネットワーク同定を可能にするものである.これについては国際会議SSCI2023(2023 IEEE Symposium Series on Computational Intelligence)にて発表済である.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
管理職であるため充分な研究時間を確保することが困難である.しかしそれでも国際会議とは言え成果を発表することがてきている.国際会議の成果は変数重要度の質悪化を回避するための方法の実問題への適用例である.他方,どのような状況で変数重要度の質が悪化するかに関する研究は,2023年度の発表は実現できなかったものの,2024年度の発表が決定している.
|
Strategy for Future Research Activity |
どのような状況で変数重要度の質が悪化するかに関する研究について学会発表のみでなく,論文としてまとめる予定である.また重み付け手法を適用した,シングルセルデータからの遺伝子ネットワーク同定法に関しても,国際会議論文で発表するだけでなく,雑誌論文として投稿する予定である. ランダムフォレストには回帰問題用と分類問題用の2種類が存在するが,本研究ではこれまで回帰問題のみを対象としていた.同様の問題が分類問題においても存在するかに関しても研究を行う予定である.
|
Report
(2 results)
Research Products
(2 results)