研究課題/領域番号 |
22K12193
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61040:ソフトコンピューティング関連
|
研究機関 | 鳥取大学 |
研究代表者 |
木村 周平 鳥取大学, 工学研究科, 教授 (20342777)
|
研究期間 (年度) |
2022-04-01 – 2026-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
2,860千円 (直接経費: 2,200千円、間接経費: 660千円)
2025年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2024年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2023年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2022年度: 390千円 (直接経費: 300千円、間接経費: 90千円)
|
キーワード | ランダムフォレスト / 変数重要度 / 遺伝子ネットワーク同定 / 重み付け |
研究開始時の研究の概要 |
研究代表者は回帰問題において学習データ内に似た事例が多数含まれる場合に,少なくとも変数重要度の観点においてランダムフォレストの性能が悪くなるという,これまでに知られていない現象を発見した.本研究ではまず,この性能悪化の原因・悪化する性能の範囲を明らかにする.次に,明らかにした原因を参考に,性能悪化への汎用的な対処方法の開発を行う.これによりランダムフォレストの性能悪化を防ぎ,利便性の向上を目指す.最後に,開発した性能悪化対処法を研究代表者が過去に開発したランダムフォレストのアプリケーション,並びにこれから開発する予定のランダムフォレストのアプリケーションへ適用することで,その有用性を実証する.
|
研究実績の概要 |
本研究は人工知能技術の一種であるランダムフォレストにおいて,偏りのある学習データを与えて学習させたときに,変数重要度の質が大きく悪化する原因について調査するとともに,その性能悪化を回避するための方法を模索するものである. 本年度も前年度に引き続き,ランダムフォレストの変数重要度に関する性能が悪化するような学習データの偏りに関する調査を行った.その結果,学習データに似た事例が1点に大量に含まれる場合だけでなく,直線上に偏って事例が存在する場合や,高次元部分空間に偏って存在する場合にも,ランダムフォレストの変数重要度の質が悪化することを示した.前年度の研究において,訓練事例に適切な重み付けを行うことで変数重要度の質悪化が回避できることを示している.この研究は実問題を通してのみの研究であったが,一般の問題においても多くの場合,訓練事例に適切な重み付けを行うことで,変数重要度の質の悪化が回避できることを実験的に明らかにした.このことに関しては令和6年度に学会発表が決まっている.前述の実験では訓練事例が高次元部分空間に偏って存在する場合には,重み付け手法による変数重要度の質悪化が回避できないことが分かっている.そのような状況は実問題において起こりにくいと考えるが,そのような場合にも質悪化を回避する方法を模索したい. 他方,重み付け手法の適用として新たな遺伝子ネットワーク同定法の開発を行った.これまでの方法と異なり,シングルセルデータから遺伝子ネットワーク同定を可能にするものである.これについては国際会議SSCI2023(2023 IEEE Symposium Series on Computational Intelligence)にて発表済である.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
管理職であるため充分な研究時間を確保することが困難である.しかしそれでも国際会議とは言え成果を発表することがてきている.国際会議の成果は変数重要度の質悪化を回避するための方法の実問題への適用例である.他方,どのような状況で変数重要度の質が悪化するかに関する研究は,2023年度の発表は実現できなかったものの,2024年度の発表が決定している.
|
今後の研究の推進方策 |
どのような状況で変数重要度の質が悪化するかに関する研究について学会発表のみでなく,論文としてまとめる予定である.また重み付け手法を適用した,シングルセルデータからの遺伝子ネットワーク同定法に関しても,国際会議論文で発表するだけでなく,雑誌論文として投稿する予定である. ランダムフォレストには回帰問題用と分類問題用の2種類が存在するが,本研究ではこれまで回帰問題のみを対象としていた.同様の問題が分類問題においても存在するかに関しても研究を行う予定である.
|