2014 Fiscal Year Research-status Report
統計的学習理論と凸最適化アルゴリズムに基づく大規模データの自動分類法に関する研究
Project/Area Number |
25330045
|
Research Institution | Shonan Institute of Technology |
Principal Investigator |
小林 学 湘南工科大学, 工学部, 教授 (80308204)
|
Co-Investigator(Kenkyū-buntansha) |
平澤 茂一 早稲田大学, 理工学術院, 名誉教授 (30147946)
|
Project Period (FY) |
2013-04-01 – 2016-03-31
|
Keywords | ビッグデータ / 統計的学習理論 / 凸最適化 / メトリックラーニング / 隠れ属性モデル分析 / 故障診断 / 動的再構成回路 |
Outline of Annual Research Achievements |
平成25年度に調査を行った統計的手法及び凸最適化によるパターン認識技術をもとに,著書「入門 パターン認識と機械学習」としてコロナ社から刊行を行った. これらの準備をもとに,まず凸最適化手法を用いたメトリックラーニング手法の開発を行った.具体的にはビッグデータの自動分類手法において重要となるデータ間のマハラノビス距離尺度を,効果的な凸最適化手法である交互方向乗数法(ADMM)を用いて求める手法を提案した.この手法は,マハラノビス距離の持つべき性質を評価項目に組み込むと,かなり広範囲に効率的な最適化を実行し,所望のマハラノビス距離を高速に求めることができる.またその収束性及び最適性を保証しており,並列化も可能である.本成果は国際会議および論文誌への掲載が決定している. 一方大規模データ解析を目的とした,隠れ属性の存在する確率モデルにおける特徴抽出手法の提案を行った.具体的にはクラウド上に存在する大規模な大学の学籍情報や学生・教員・授業データを用いて,フレキシブルな隠れ属性が存在する確率モデルに対し,EMアルゴリズムを用いることにより収束を保証した特徴抽出アルゴリズムを提案している.結果的に学生の特徴だけでなく教員の授業の特徴を出力することができ,FD活動などにデータを活用することを可能とした. さらに大規模故障診断問題を対象として,故障に対するモデルをランダムマルコフフィールドと捉え,効果的な積和アルゴリズムとその性能評価を行った.結果的にこのアルゴリズムは収束性及び最適性を保証している.さらにこのアルゴリズムは並列計算を可能とし,大規模計算向きアルゴリズムとなっている.これらの結果は IEEE 国際会議に発表済みである. またこれらの最適化手法を用いた動的再構成回路の設計に関する論文を投稿し,採録されている.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
おおむね平成26年度の研究計画通りに進捗している. 機械学習及びパターン認識において,凸最適化及び統計的学習に関する著書を刊行した. また査読付き学術論文誌掲載3件,査読付き国際会議4件,国内学会発表3件と,順調であると考える.
|
Strategy for Future Research Activity |
大規模データに対する数理モデル及びアルゴリズムの開発が十分進んで準備が整ったため,今後はさらに大規模なデータに対する実験に注力する.現在まで利用してきた湘南工科大学のサーバ施設の他に,本年導入予定のサーバ類を利用することにより,大規模データの分散処理実験を行う予定である.これにより自動分類の精度評価,分散処理によるネットワークの使用量と計算量の最適化などの評価を行う.またアルゴリズムにおける各種パラメータの最適化なども行う予定である.最終的に本プロジェクトで開発を行った数理モデルや各種アルゴリズムの評価や妥当性の検証を行う. 電子情報通信学会 I-Scover プロジェクトメンバーとして,大規模なメタデータの横断的検索システムの開発に携わっている.これは平成27年11月のロールアウトを予定しており,こちらにも大規模データ解析手法の導入を目指している.
|
Causes of Carryover |
購入を予定していた実験用サーバ機について,今年度も湘南工科大学の実験設備を利用することができたため,購入を見送ったことによる.
|
Expenditure Plan for Carryover Budget |
これまでの研究成果により,大規模データの並列解析手法についてアルゴリズム及び理論的な準備が整った.そのためデータ解析に必要な並列分散処理用のスペックの機器を本年購入予定である.また随時国内・海外において成果発表を行う予定であり,そのための旅費として使用予定である.さらに発表に利用するためのノートPCの購入を予定している.
|
Research Products
(12 results)