研究実績の概要 |
主に階層的クラスタリングであるBIRCHのアクターモデル上の実装の改良と実験を進めた. 前年度に実装したBIRCHは初期段階の設計であり, 本年度は設計をより詳細に検討し, 再実装を行なった. 具体的には,並列化された入力が木を根から末端に辿る際に誤った箇所に到達することがあり,その到達箇所を適宜修正する改良を加えた. 実験データとしてはImageNetとして知られる大規模な画像データベースの特徴量を用意し, その内部の中間出力を入力として開発したアクターモデルを利用したBIRCHアルゴリズムに投入した. 画像データベースの特徴量は, 関連する研究であるPERCHと呼ばれるアルゴリズムの論文で採用された手法を使い, 画像の分類に利用する畳み込みニューラルネット(CNN)の中間出力を特徴量として利用する. これにより学習済みのCNNを利用し画像データをBIRCHで扱うことのできる固定長の入力に変換することができる. アクターモデル上のBIRCHで階層的クラスタリングを行うことで, 逐次的で大規模な分類に対応できることを確認している. 予備的な実験では入力データ数が37万程度で木のノード数が50万程度作成され, 問題なく動作することを確認している. また, これらの実装と実験は実験は現状で単一の計算機上の並列環境で行なっている. 並列環境では前年度の結果と合わせて並列化の効果を確認している. また同時に分散環境への対応も実装を進めた. アクターモデルでは分散化が比較的用意であり, 分散環境での実験の準備が概ね整った.
|