汎用性獲得のための統計的ラフ集合手法によるルール導出法の改善と判別問題への適用
Project/Area Number |
20K11937
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 61030:Intelligent informatics-related
|
Research Institution | Shimane University |
Principal Investigator |
加藤 裕一 島根大学, その他部局等, 名誉教授 (10161126)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Project Status |
Granted (Fiscal Year 2022)
|
Budget Amount *help |
¥2,860,000 (Direct Cost: ¥2,200,000、Indirect Cost: ¥660,000)
Fiscal Year 2022: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
Fiscal Year 2021: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
Fiscal Year 2020: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
|
Keywords | If-then ルール / 決定表 / 事後確率最大化推定法 / Random Forest / 判別分析 / ベイジアンネットワーク / 部分一致仮説モデル / データ発生・ルール導出検証モデル / トランザクションデータベース / 共起集合 / 相関ルール法 / ラフ集合理論 / 統計的ルール導出法 / 学習・判別問題 / ルール導出法の性能評価システム / 不適合性の原理 |
Outline of Research at the Start |
従来のSTRIMは分かり易さを優先し,ルールの完全一致,重要度を考慮しない条件属性を仮定した。このモデルを人間の判断モデルに近い部分一致で重要度を配慮したルール導出法に発展させる。この導出法の正当性は,シミュレーションによるデータ発生・ルール導出検証モデルで確認する。更に研究目的で記した各種複雑モデルとSTRIMを検証モデルデータに適用して,両者の判別性能実験とその差分を明確にして,複雑モデルの記述レベルを「不適合性の原理」の観点から議論する。STRIMの人間に分かり易い記述モデルと複雑モデルの判別問題への適用が相補的に利用できることを議論する。
|
Outline of Annual Research Achievements |
決定表と呼ばれるデータベースに潜む因果関係をif-thenルール形式で推定する手法として,申請者はSTRIMが提案した.この手法は,従来のラフ集合理論の下近似・上近似集合を利用したルール導出法を,統計的観点から有意水準を有するルール導出法に改善したものである. R4年度の前半では,シミュレーション実験を中心に,従来のSTRIMをBayes的手法から見直しBayesian STRIMへと発展させた.この手法により、適切なデータサイズが確保できれば、予め設定したルールを過不足なく推定できる目途が付いた. 後半では,実データ(楽天トラベルデータ)への適用を目指した.実データは,シミュレーションデータと異なり,多くの汚れたデータを含んでいる.このため,有意水準を満たさないルールも含み判別実験を実施してRandom Forest(RF)と同等以上の判別成績を出力するexpanded STRIM(ex-STRIM)を提案した.推定したルールをベースにした判別実験はルール推定成績の目安である(実データである為,真のルールが何か分からない).一方で木構造をベースにBootstrap法を利用するRFは,人間に理解できるどの様なルールも導出できない為,意思決定利用に多くの不安が付きまとう.更にex-STRIMが含む主要な幹,枝,葉となるルールに整理して,人間の意思決定に利用できる考察をしている.このような考察を国内外の学術雑誌に現在投稿中である.国内誌からは4月4日付けで採録通知を受け取っている.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
expanded STRIMにより,実データへの適用の目途が付いた.今後,多くの実データに適用して,その有効性を確認すると共に,実データ毎の固有の特徴に対応する様々な改善策を考察出来る段階にきた.
|
Strategy for Future Research Activity |
近年のインターネット社会の進展により,大量の電子データが発生・蓄積されている。このデータを整理・分析・要約して様々な政策・ビジネス戦略に有効活用することが日常化している.このような人間の意思決定利用状況での重要な問題は,人に理解できる整理・分析・要約表現である.ディープラーニング等によるAI化は確かに便利であるが,そのプロセスは,ブラックボックス化されて,何故そのような決定が合理的なのか,配慮しなければならない点は何か等が分かり難い状況が生まれている.このような最近のAI化の問題点を,STRIMにより改善出来ることを多くの事例で示す.
|
Report
(3 results)
Research Products
(8 results)