2017 Fiscal Year Research-status Report
多種センサとクラウドを活用した分散リアルタイム機械学習処理基盤
Project/Area Number |
16K00177
|
Research Institution | National Institute of Informatics |
Principal Investigator |
竹房 あつ子 国立情報学研究所, 大学共同利用機関等の部局等, 准教授 (70345411)
|
Co-Investigator(Kenkyū-buntansha) |
高野 了成 国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 研究グループ長 (10509516)
小口 正人 お茶の水女子大学, 基幹研究院, 教授 (60328036)
中田 秀基 国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 研究主幹 (80357631)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | クラウドコンピューティング / 分散処理 / ディープラーニング / 機械学習 / 資源管理 |
Outline of Annual Research Achievements |
本研究は,大量のセンサデータに対し、センサ群およびクラウドの計算資源を有効活用して高精度な解析を即時に行う分散リアルタイム機械学習処理基盤を開発することを目的としている。 多種センサを配備し、それらから収集された情報をクラウドに集約して解析することが可能になってきた。一方、カメラの動画像はデータ量が膨大なためクラウドへの集約は難しく、その解析処理に必要な計算量も多いため、リアルタイムに高精度な解析を行うのは非常に困難である。 よって、センサとクラウドの計算資源を活用した分散環境でディープラーニングによる高精度な機械学習処理を実現する。これにより、動画像と他のセンサデータを利用した高精度なリアルタイム解析を容易にし、様々な次世代サービスアプリケーションの創出に寄与する。 H29年度は、機械学習フレームワークの1つであるCaffeを拡張した、センサ側とクラウド側の計算機でパイプライン的に分散画像解析処理を行う手法の評価をまとめるとともに、昨年度構築した分散メッセージングシステムであるApache Kafkaと大規模分散処理フレームワークのApache Sparkを用いたセンサデータのための分散リアルタイム処理基盤を評価した。Kafkaの評価では、メッセージをオンメモリで管理するブローカ間の通信帯域が十分にないと性能が劣化すること、それに伴い全体の処理スループットが律速してしまうことが分かった。また、Sparkではデータローカリティを重視したスケジューリングを行うため、ストリーミングデータのリアルタイム処理で並列化効率を上げるのは困難であることが明らかとなった。 本研究の成果は、電子情報通信学会論文誌で1件発表するとともに、査読付き国際会議2件、国内の研究会等で9件の発表を行った。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
H29年度は、昨年度に構築したプロトタイプ実装をもとに分散リアルタイム機械学習処理基盤を構築し、より詳細な評価を行ってシステムの性能特性の抽出を行うことができた。
|
Strategy for Future Research Activity |
概ね順調に進んでいるが、既存の分散処理基盤での技術的課題も明らかになったため、H30年度は他の分散処理基盤との比較・評価を行い、処理基盤の最適化と機械学習処理の高精度化を進める。また評価モデルを構築し、提案システムの有効性を実証する。
|
Causes of Carryover |
国際会議での成果発表を行うため、最終年度への繰越しを行った。
|