2022 Fiscal Year Research-status Report
汎用性獲得のための統計的ラフ集合手法によるルール導出法の改善と判別問題への適用
Project/Area Number |
20K11937
|
Research Institution | Shimane University |
Principal Investigator |
加藤 裕一 島根大学, その他部局等, 名誉教授 (10161126)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Keywords | If-then ルール / 決定表 / 事後確率最大化推定法 / Random Forest / 判別分析 |
Outline of Annual Research Achievements |
決定表と呼ばれるデータベースに潜む因果関係をif-thenルール形式で推定する手法として,申請者はSTRIMが提案した.この手法は,従来のラフ集合理論の下近似・上近似集合を利用したルール導出法を,統計的観点から有意水準を有するルール導出法に改善したものである. R4年度の前半では,シミュレーション実験を中心に,従来のSTRIMをBayes的手法から見直しBayesian STRIMへと発展させた.この手法により、適切なデータサイズが確保できれば、予め設定したルールを過不足なく推定できる目途が付いた. 後半では,実データ(楽天トラベルデータ)への適用を目指した.実データは,シミュレーションデータと異なり,多くの汚れたデータを含んでいる.このため,有意水準を満たさないルールも含み判別実験を実施してRandom Forest(RF)と同等以上の判別成績を出力するexpanded STRIM(ex-STRIM)を提案した.推定したルールをベースにした判別実験はルール推定成績の目安である(実データである為,真のルールが何か分からない).一方で木構造をベースにBootstrap法を利用するRFは,人間に理解できるどの様なルールも導出できない為,意思決定利用に多くの不安が付きまとう.更にex-STRIMが含む主要な幹,枝,葉となるルールに整理して,人間の意思決定に利用できる考察をしている.このような考察を国内外の学術雑誌に現在投稿中である.国内誌からは4月4日付けで採録通知を受け取っている.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
expanded STRIMにより,実データへの適用の目途が付いた.今後,多くの実データに適用して,その有効性を確認すると共に,実データ毎の固有の特徴に対応する様々な改善策を考察出来る段階にきた.
|
Strategy for Future Research Activity |
近年のインターネット社会の進展により,大量の電子データが発生・蓄積されている。このデータを整理・分析・要約して様々な政策・ビジネス戦略に有効活用することが日常化している.このような人間の意思決定利用状況での重要な問題は,人に理解できる整理・分析・要約表現である.ディープラーニング等によるAI化は確かに便利であるが,そのプロセスは,ブラックボックス化されて,何故そのような決定が合理的なのか,配慮しなければならない点は何か等が分かり難い状況が生まれている.このような最近のAI化の問題点を,STRIMにより改善出来ることを多くの事例で示す.
|
Causes of Carryover |
コロナの影響もあり,研究活動・学会活動が停滞した影響があった。国内外での学会発表に参加する機会が少なく,出張費等を利用しなかったことがあげられる。具体的には,2022年7月にニューヨークに出張する予定だったが、参加できなかった.本年度は,コロナも落ち着き,現在、参加予定の学会・研究会がある.また現在当投稿中の論文が採録となり,このような学会参加費・論文別刷り費などに利用する予定である.
|