2016 Fiscal Year Research-status Report
多目的遺伝的機械学習手法による大規模多属性データからの知識獲得
Project/Area Number |
16K00336
|
Research Institution | Osaka Prefecture University |
Principal Investigator |
能島 裕介 大阪府立大学, 工学(系)研究科(研究院), 准教授 (10382235)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | 知識獲得 / 多目的最適化 / 並列分散実装 |
Outline of Annual Research Achievements |
平成28年度は,(1)大規模データに対して,並列分散に適した進化型多目的最適化手法の選定と,個体群とデータ分割方法検討,(2)多属性データに対して,誤識別パターンを中心とした複数パターンからのルール生成法の検討を行った.(1)に関しては,これまでのNSGA-IIに加え,近年注目されているMOEA/Dを用いた並列分散モデルの実装を行った.MOEA/Dは,多目的最適化問題を複数の単一最適化問題に分割して解く手法であり,様々なスカラー化関数が利用可能である.本年度は,一般的に用いられる荷重和関数やチェビシェフ関数の性能比較を行った.また,新しいスカラー化関数も検討し,2017 IEEE International Conference on Fuzzy Systemsに投稿し採択されている.ファジィ集合だけでなく,区間集合を用いた並列分散実装の成果も2016 IEEE Congress on Evolutionary Computationで発表している.(2)に関しては,複数パターンからのルール生成におけるパターン数の違いによる識別性能の比較を行った.属性数の大きなデータに関しては,多数のパターンからルールを生成することで汎化性の高い識別器が獲得可能であることを明らかにした.また,ルール生成に使用するパターン数をランダムに変化させる方法の提案と検討を行い,Joint 17th World Congress of International Fuzzy Systems Association and 9th International Conference on Soft Computing and Intelligent Systemsに投稿し採択されている.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
H28年度は,多目的ファジィ知識獲得に関して,複数の進化型多目的最適化アルゴリズムの比較および,MOEA/Dのスカラー化関数として新しいAccuracy-oriented function, AOFを提案し有効性を検証した.また並列分散実装により大規模データに対する性能比較も行った.これらの成果をまとめ,ファジィ理論に関する世界最大級の国際会議2017 IEEE International Conference on Fuzzy Systemsに投稿し採択されたことにより,一定の評価が得られたと考えている. 大規模データからの並列分散型遺伝的機械学習による知識獲得として,区間集合を用いたGAssistの並列分散実装を行い,ファジィ遺伝的機械学習との比較を行った.現在,GAssistの多目的最適化に関する成果をまとめており,国際会議論文として投稿する予定である.ファジィ集合だけでなく,区間集合を用いた知識獲得の検証が行い順調に成果を上げていると考えている. 多数パターンからのルール生成においては,ルール生成に利用するパターン数の設定という問題があったが,世代ごとにランダムに設定することで,単一の設定での問題を緩和することが可能であることがわかり,今後,大規模多属性データへの適用と性能改善が期待できる. また,H29年度は,大規模多属性データへの適用と,Hadoopエコシステムの利用を課題として挙げているが,それぞれの前段階の実験がH28年度に行うことができたため,順調に研究が進んでいると考えている.
|
Strategy for Future Research Activity |
H29年度は,MOEA/Dを並列分散実装するにあたり,AOFにおけるルール数の値域が異なる島モデルや,異なるスカラー化関数を別々の島に配置する方法を現在検証中である.このようなモデルの改良により,従来の並列分散実装による高精度方向への探索改悪を改善できると考えている.また,NSGA-IIやMOEA/Dの並列実装は幾つか提案されており,それらとの比較もH29年度の課題である. また,これまで別々に実装していた,並列分散型GAssistと多目的型GAssistとの組合せによる並列分散多目的GAssistの構築と,並列分散多目的ファジィ遺伝的機械学習との比較実験もH29年度の課題である.さらに,継続的に遺伝的機械学習手法の調査研究を行い,多目的化や並列分散実装に適した手法の選定と改良も行う予定である. 大規模多属性データに関しては,これまでのベンチマークデータを用いた実験だけでなく,実問題で得られたデータの利用も行う予定である.例えば,ロケットエンジンの最適設計で得られたデータ,自動車のパーツ最適化で得られたデータ,fMRIによる脳活動データなど利用する予定である. Hadoopエコシステムの利用に関しても,個体群評価を並列化する実装は行い現在実験を行っているところである.これまでの並列分散実装とは異なる実装方法を検討する必要があることが明らかになってきており,より適した実装方法を検討する予定である.
|
Causes of Carryover |
プログラミングと実験結果解析用のコンピュータを購入しなかったため.また謝金に関しても雇用日数を減らしたため.
|
Expenditure Plan for Carryover Budget |
プログラミングと実験結果解析用のコンピュータの購入あるいは謝金に利用する予定である.
|
Research Products
(7 results)