2019 Fiscal Year Annual Research Report
Development of an improved method for selective recording of execution history and its new applications
Project/Area Number |
17K00096
|
Research Institution | Kanazawa University |
Principal Investigator |
櫻井 孝平 金沢大学, 電子情報通信学系, 助教 (80597021)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | アクターモデル / 機械学習 / 大規模データ処理 |
Outline of Annual Research Achievements |
本研究は大規模なデータに対する処理方法に対して検討を行った結果, 木構造のモデルを使ったデータ処理をアクターモデルを使った並列分散環境上で実現する手法を提案・開発した. それらのデータ処理は主に機械学習を想定し, 具体的には大規模なデータの分類や階層的なクラスタリングに対応する. それらの手法は木を漸進的に構築するが, 構築にはトップダウンとボトムアップの区別ができ, それぞれ課題と解決方法が異なる. トップダウンは, 例えば決定木学習のオンライン学習アルゴリズムが該当し, 単一の木のルートに入力を与えて, 木を成長させるが, 本研究の手法では木を複製して分散させることで処理を高速化した. ボトムアップについては, 例えば階層的クラスタリングのアルゴリズムが該当し, 本研究では木のノードの接続を拡張することで並列的な入力に対してデータの不整合を回避する手法を取入れた. これらの本研究の提案は設計のパターンとしてActor Tree Proxy Patternとしてまとめることができる. 最終年度では, 前年度までの結果を踏まえて, 提案したシステムの分散化に関するより本格的な実験を実施した. 実験では, より実践的で大規模な実験データとして, 任意のサイズの入力を自動生成可能な決定期学習のためのデータと, OpenImageと呼ばれる大規模な画像分類から得られた特徴データを利用した. これらのデータは100万から170万件の要素からなり, 本研究で提案したシステムの実装はいずれの入力も扱うことが可能で, さらにアクターモデルを利用しない既存のシステムと比べて, 並列環境での改善は 1.4倍から3.1倍の速度向上を確認し, さらに2台の分散計算機環境でより多くのメモリを扱えることで100万件以上のデータの処理が可能であることを確認した.
|
Research Products
(1 results)