2017 Fiscal Year Research-status Report
多目的遺伝的機械学習手法による大規模多属性データからの知識獲得
Project/Area Number |
16K00336
|
Research Institution | Osaka Prefecture University |
Principal Investigator |
能島 裕介 大阪府立大学, 工学(系)研究科(研究院), 准教授 (10382235)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | 知識獲得 / 多目的最適化 / 並列分散実装 |
Outline of Annual Research Achievements |
H29年度は,複数サーバーを用いた並列分散多目的ファジィ遺伝的機械学習実装を中心に取り組んだ.現在主流となりつつあるビックデータ解析ライブラリ(Spark)の利用を試みたが,並列分散多目的ファジィ遺伝的機械学習とはアルゴリズムの構造上相性が悪く,多少改良したところで大幅に計算時間が増加し,複数サーバーを用いるメリットがないことが明らかになった.そこで無理にライブラリに合わせた改良は行わず,Javaのソケット通信を利用したマスタスレイブ型の実装を行い,複数のサーバーを用いたスケールアップが可能であることを確認,1千万パターンのデータまで実時間で適用可能であることを明らかにした.この成果をまとめ論文を執筆中である. また,並列分散実装を行うことで,複雑ではあるが高精度な識別器の獲得が困難である問題に関して,進化型多目的最適化手法MOEA/Dの改良を行い,新しいスカラー化関数の提案および既存スカラー化関数との組合せについても検討を行った. さらに,本年度は,区間型遺伝的機械学習の並列分散実装に関して,並列分散の特徴を利用したアンサンブル識別器の設計にも着手している.現在のところ小規模データでのアンサンブル効果は確認できたが,大規模データに対しては,まだ改良の余地が多く残されている状態である. 多属性データへの応用として,fMRIデータへの適用,マイクロアレイ遺伝子発現データへの適用を試みている.各種属性選択手法との併用や,他の機械学習との比較を行った.また.ファジィ遺伝的機械学習のルール評価指標の違いによる影響を調査した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
複数サーバーを用いた並列分散多目的ファジィ遺伝的機械学習手法により,1千万パターンのデータも扱えるようになり,精度と複雑性の異なる識別器が獲得できるようになった.これは,繰り返し計算を必要とする進化計算に基づく知識獲得手法では余り実現されておらず,評価に値すると思われる.本成果は,現在論文誌投稿に向けて執筆中である.また,H29年度は,研究成果を3つの国際会議および1つの国内会議で発表することができた.
|
Strategy for Future Research Activity |
本年度開発した複数サーバーを用いた並列分散型多目的ファジィ遺伝的機械学習は,優越関係に基づくNSGA-IIが最適化ツールとして使っている.H30年度は,別途改良を行っていたMOEA/Dを用いた並列分散型多目的ファジィ遺伝的機械学習も,1千万パターン級のデータに適用し,比較実験を行う予定である. 区間型遺伝的機械学習のアンサンブル化,および,大規模データへの適用も引き続き行う予定である.さらに,fMRIデータやマイクロアレイ遺伝子発現データなど属性数が多いデータに対する遺伝的機械学習手法の改良も行う予定である.
|
Causes of Carryover |
次年度使用額に関しては,本年度のヨーロッパ出張において,他の出張と日程が連続したため,航空運賃の支払い額が減ったことが主な原因である.翌年度分として請求した助成金と合わせて,国内外の出張旅費ならびにプログラミングや実験結果解析の人件費に使用する予定である.
|
Research Products
(4 results)