2013 Fiscal Year Research-status Report
カテゴリ追加を考慮した大規模データにおけるスパースサポートベクトルマシンの開発
Project/Area Number |
25871033
|
Research Category |
Grant-in-Aid for Young Scientists (B)
|
Research Institution | National Institute of Technology, Toyama College |
Principal Investigator |
北村 拓也 富山高等専門学校, 電気制御システム工学科, 助教 (40611918)
|
Project Period (FY) |
2013-04-01 – 2015-03-31
|
Keywords | パターン認識 / 機械学習 / サポートベクトルマシン / スパース / オンライン学習 |
Research Abstract |
顔認証のように, 逐次的に登録人物が増加する問題が存在しており, サポートベクトルマシン (SVM) のような識別精度が高い一方, 複雑な計算を伴う識別器は本問題には不向きと考えられていた. そこで, カテゴリ追加型学習が可能なスパースSVM (S-SVM)の開発を行うことにより, 高い識別精度を維持させると同時に計算コストの面においても実用的となる. 本機関における研究において以下の実績が挙げられた. (1) カテゴリ追加型学習可能なS-SVMの学習アルゴリズムの構築:カテゴリごとに独立して学習に必要な教師サンプルをコレスキー分解により選択し, それらによって新たな特徴空間を生成する. それらの特徴空間上でそれぞれ識別基準を決定する. これにより新たにカテゴリが追加された場合, そのカテゴリのみ学習すればよいため, 効率的な学習が行える. ベンチマークデータを用いた実験により, 数倍~数十倍の計算速度の向上が見られた. (2) 顔認証実験によるS-SVMの性能検証:52人分の顔画像を100枚ずつ収集し, それらを用いてS-SVMの性能検証を行った. 本手法では1人を登録するために必要な学習時間は一般的なPCであっても約1~2秒と非常に短く, 連続したカテゴリの追加においても実用的と考えられる. (3) 同時定式化を用いた識別基準の線形結合:識別性能維持のための識別基準の線形結合の手法として, 一対他方式やペアワイズ方式など通常のSVMを多クラス問題へ拡張する際に用いる方式を用いたが, 一部のデータにおいては識別精度の劣化が見られたため, 全カテゴリを同時に考慮し, 識別基準を新たに決定する同時定式化方式の導入を試みた. その結果, 他の2つの方式に比べて高い識別精度を安定して保っていることを明らかにした.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
研究の目的であるカテゴリ追加を考慮した大規模データにおける追加型スパースサポートベクトルマシンのアルゴリズムを完成させ, プログラムによりシステムの構築を行った. 評価方法として研究計画通り, 一般公開されているUCIデータセットというパターン認識分野において広く用いらているデータセットを用いた. 結果, 従来の手法に比べて有効的な結果が得られた. また, 平成26年度に実行予定であった個人認証システムへの適用を顔画像を用いて行い, 優れた成果が得られた. これらに関する研究成果は担当している卒業研究生と共に2013年9月に九州大学にて開催された第23回インテリジェントシステムシンポジウム (FAN2013) や2013年11月に大邱(韓国)にて開催されたInternational Conference on Neural Information Processing (ICONIP2013)や2014年2月に福岡大学にて開催されたパターン認識・メディア理解研究会や2014年3月に筑波大学東京キャンパスにて開催された第41回知能システムシンポジウムにて発表した. 以上のように, 当初の計画よりも少し進展している状況であることがいえる.
|
Strategy for Future Research Activity |
カテゴリごとに特徴空間を生成する際, 現在ではコレスキー分解を用いて生成に必要な教師データを選択している. しかしながら, コレスキー分解ではそのカテゴリの特徴をよく表せるデータの選択は可能であるが, 識別において重要なデータの選択を行っているわけではない. そこで, マージン最大化の観点から特徴空間を生成する教師データの選択をすることにより識別において重要なデータの選択を可能にする学習アルゴリズムの構築を行う. さらに, 個人認証技術への適用を実現し, 本アルゴリズムの性能検証を行う. これらの結果は論文誌や国際会議や国内会議にへの論文投稿により公表する.
|
Expenditure Plans for the Next FY Research Funding |
平成26年3月までに物品の納品や出張は完了しているが, 4月支払いとなったため次年度使用額が生じた. 上記の理由により, 3月の物品購入や出張などにより次年度使用額分の助成金は使用している.
|