2017 Fiscal Year Annual Research Report
マルコフ確率場計算の効率化と機械学習への革新的応用
Project/Area Number |
16J07267
|
Research Institution | The University of Tokyo |
Principal Investigator |
古田 諒佑 東京大学, 情報理工学系研究科, 特別研究員(DC1)
|
Project Period (FY) |
2016-04-22 – 2019-03-31
|
Keywords | マルコフ確率場 / 畳み込みニューラルネットワーク |
Outline of Annual Research Achievements |
平成29年度も,平成28年度と同様に、私の研究課題について,「マルコフ確率場計算の効率化」と「機械学習への応用」の2つに分けて研究を進めた。以下にその研究実施状況について報告する. マルコフ確率場は画素ラベリング問題によく用いられるモデルであり,その近似最適化手法としてコストボリュームフィルタリング[Rhemann, CVPR11]という手法がある.この手法は上述の問題一般に広く適用可能であり高い性能を発揮するが,ラベルの種類が多い場合には計算が遅くなってしまうという問題点があった.そこで私はコストボリュームフィルタリングを基に,階層的なラベル選択の処理を行うことで,ラベルの種類が多い場合でも高速に動作する手法を提案した.申請書の「現在までの研究状況」の欄で述べたように,手法自体は完成しており,国際会議で発表済みであった.しかし1種類の画素ラベリング問題で小規模なデータセットでしか実験していなかったため,平成29年度は追加実験を行い新たなデータセットおよび新たな画素ラベリング問題に適用し,提案手法が広く有用であることを確認した. 機械学習への応用に関しては,マルコフ確率場と畳み込みニューラルネットワーク(CNN)の統合学習について研究を進めた.平成28年度はまだ着想段階であったが,平成29年度は手法を発展させ,実験にて有用性を確認した.具体的には,不動点反復法によるマルコフ確率場の最適化計算が再帰的な畳み込み演算と数学的に等価であることを導出し,CNNの一部として表現することで,CNNとマルコフ確率場のパラメータを逆誤差伝搬で同時に学習できるモデルを提案した.このモデルでは,マルコフ確率場の最適化計算は畳み込み演算の繰り返しで表現されているため,GPU上での並列処理により非常に高速に計算することができる.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
効率化に関しては,申請書の「現在までの研究状況」の欄で述べたように,手法自体は完成しており,国際会議で発表済みであった.しかしステレオマッチング問題のみでMiddlebury Stereo Benchmark v2と呼ばれる小規模なデータセットでしか実験していなかったため,平成29年度は追加実験を行いKITTI Stereo Benchmarkと呼ばれる比較的大規模かつ高難易度の新たなデータセット,およびオプティカルフロー推定という新たな画素ラベリング問題に適用し,提案手法が広く有用であることを確認した.具体的には,KITTIデータセットではおよそ6倍高速化した上でエラー率も10%低下した.オプティカルフロー推定ではおよそ19倍高速化しエラー率は1%低下した.この結果は国際論文誌に採択された. 機械学習への応用に関しては,画素ラベリング問題の1つである意味領域分割のデータセット(PASCAL VOC 2012)を用いて実験を行ったところ,CNN単体と比較して精度が1.9%ほど向上した.また,類似したアイデアで条件付き確率場とCNNを統合学習する手法[Zheng, ICCV2015]と比較して,同程度の精度で2倍ほど高速であることを確認した.また,上記のCNNを用いた意味領域分割のマルチメディアにおける新たな応用として,インタラクティブな画像検索システムを提案した.ただCNNによる意味領域分割の結果を用いて画像検索するだけではなく,直積量子化を上手く組み合わせることで,検索精度をほぼ落とすことなく高速で省メモリな検索を可能にしている.従来のテキストベースの検索システムと提案システムを組み合わせることで,ユーザーが思い描いた画像をより正しく検索できるようになったことを主観評価実験にて確認した.この内容を国際会議にて発表も行った.
|
Strategy for Future Research Activity |
現在,新たな学習方法として,世界で初めて強化学習を利用して画素ラベリング問題を解く研究を進めている.強化学習とは,従来の教師有り学習とは異なり,エージェントが試行錯誤を通して学習していく機械学習手法である.有名どころでは,囲碁においてプロの棋士を打ち負かしたGoogle DeepMindのAlphaGo[Silver, Nature2017]や,人間と遜色ないレベルでテレビゲームをプレイするDeep Q Network[Mnih, Nature2015]に代表されるように,強化学習は問題によっては教師有り学習では成しえなかった大きな成功を収める可能性を秘めている.私は強化学習を画像のノイズ除去の問題に適用し,最新の教師有り学習によるノイズ除去手法と同程度の性能を発揮することを実験にて確認した.さらにマルコフ確率場のように,近傍の画素への影響も考慮して強化学習を行う手法を提案し,精度が向上することも確認している.今後は画像の超解像などの,ノイズ除去以外の問題にも適用していく予定である.
|