ランダムフォレストにおける変数重要度の質改善方法の開発とその応用
Project/Area Number |
22K12193
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 61040:Soft computing-related
|
Research Institution | Tottori University |
Principal Investigator |
木村 周平 鳥取大学, 工学研究科, 教授 (20342777)
|
Project Period (FY) |
2022-04-01 – 2026-03-31
|
Project Status |
Granted (Fiscal Year 2022)
|
Budget Amount *help |
¥2,860,000 (Direct Cost: ¥2,200,000、Indirect Cost: ¥660,000)
Fiscal Year 2025: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
Fiscal Year 2024: ¥650,000 (Direct Cost: ¥500,000、Indirect Cost: ¥150,000)
Fiscal Year 2023: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
Fiscal Year 2022: ¥390,000 (Direct Cost: ¥300,000、Indirect Cost: ¥90,000)
|
Keywords | ランダムフォレスト / 変数重要度 / 遺伝子ネットワーク同定 / 重み付け |
Outline of Research at the Start |
研究代表者は回帰問題において学習データ内に似た事例が多数含まれる場合に,少なくとも変数重要度の観点においてランダムフォレストの性能が悪くなるという,これまでに知られていない現象を発見した.本研究ではまず,この性能悪化の原因・悪化する性能の範囲を明らかにする.次に,明らかにした原因を参考に,性能悪化への汎用的な対処方法の開発を行う.これによりランダムフォレストの性能悪化を防ぎ,利便性の向上を目指す.最後に,開発した性能悪化対処法を研究代表者が過去に開発したランダムフォレストのアプリケーション,並びにこれから開発する予定のランダムフォレストのアプリケーションへ適用することで,その有用性を実証する.
|
Outline of Annual Research Achievements |
本研究は,人工知能技術の一種であるランダムフォレストにおいて,偏りのある訓練データを与えて学習させた際に,変数重要度の質が大きく悪化する原因について調査すること,さらには性能悪化を回避する方法を開発することを目的としている. 今年度は,ランダムフォレストにおいて,偏りのある入力データが変数重要度に及ぼす影響に関して人工的に作成した問題を対象に調査を行った.その結果,探索領域の端の一点に偏った事例が多く存在すると変数重要度の質が悪化するものの,探索領域の中央部の一点に偏った事例が多く存在しても変数重要度の質が悪化しないといった,幾らかの知見が得られたものの,そのことに関する論文はまだ未投稿である.なおこのことに関しては現在,論文を投稿準備中である. 他方,変数重要度の悪化を回避する方法として,各訓練事例に適切に重み付けする方法を検討した.その適用先として研究代表者がこれまで扱ってきた遺伝子ネットワーク同定において,偏りのある入力データの影響を軽減するために,入力データ中の各事例に対して自動で重み付けを行うことのできる手法を開発した.その成果に関してはバイオインフォマティクスに関連する国際会議(IEEE Conference on Computational Intelligence in Bioinformatics and Computational Biology)において発表した.なお本重み付け手法は,他の一般の問題においても偏りのある入力データの影響を軽減するための手法として利用可能であると考えている.一般の問題への重み付け手法の適用に関して,別の論文として執筆することを予定している.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
現在,管理職であるため充分に研究する時間を取ることが困難である中で,国際会議とは言え成果を発表することが出来ている.一般の問題に対する拡張に関する成果はまだ論文として出せてはいないものの,指導している大学院生が研究をしており,現在,論文を執筆中である.
|
Strategy for Future Research Activity |
一般の問題において偏りのある入力データが変数重要度に及ぼす影響に関する調査結果を論文にまとめる.さらに重み付け手法を利用することで,上記の問題が回避できることに関して論文にまとめる予定である.これらの方法の実問題への適用例として,新たな遺伝子ネットワーク同定問題を扱う予定である.
|
Report
(1 results)
Research Products
(1 results)