2017 年度実績報告書

マルコフ確率場計算の効率化と機械学習への革新的応用

研究課題

研究課題/領域番号	16J07267
研究機関	東京大学
研究代表者	古田諒佑東京大学, 情報理工学系研究科, 特別研究員(DC1)
研究期間 (年度)	2016-04-22 – 2019-03-31
キーワード	マルコフ確率場 / 畳み込みニューラルネットワーク
研究実績の概要	平成29年度も，平成28年度と同様に、私の研究課題について，「マルコフ確率場計算の効率化」と「機械学習への応用」の2つに分けて研究を進めた。以下にその研究実施状況について報告する．マルコフ確率場は画素ラベリング問題によく用いられるモデルであり，その近似最適化手法としてコストボリュームフィルタリング[Rhemann, CVPR11]という手法がある．この手法は上述の問題一般に広く適用可能であり高い性能を発揮するが，ラベルの種類が多い場合には計算が遅くなってしまうという問題点があった．そこで私はコストボリュームフィルタリングを基に，階層的なラベル選択の処理を行うことで，ラベルの種類が多い場合でも高速に動作する手法を提案した．申請書の「現在までの研究状況」の欄で述べたように，手法自体は完成しており，国際会議で発表済みであった．しかし1種類の画素ラベリング問題で小規模なデータセットでしか実験していなかったため，平成29年度は追加実験を行い新たなデータセットおよび新たな画素ラベリング問題に適用し，提案手法が広く有用であることを確認した．機械学習への応用に関しては，マルコフ確率場と畳み込みニューラルネットワーク(CNN)の統合学習について研究を進めた．平成28年度はまだ着想段階であったが，平成29年度は手法を発展させ，実験にて有用性を確認した．具体的には，不動点反復法によるマルコフ確率場の最適化計算が再帰的な畳み込み演算と数学的に等価であることを導出し，CNNの一部として表現することで，CNNとマルコフ確率場のパラメータを逆誤差伝搬で同時に学習できるモデルを提案した．このモデルでは，マルコフ確率場の最適化計算は畳み込み演算の繰り返しで表現されているため，GPU上での並列処理により非常に高速に計算することができる．
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由効率化に関しては，申請書の「現在までの研究状況」の欄で述べたように，手法自体は完成しており，国際会議で発表済みであった．しかしステレオマッチング問題のみでMiddlebury Stereo Benchmark v2と呼ばれる小規模なデータセットでしか実験していなかったため，平成29年度は追加実験を行いKITTI Stereo Benchmarkと呼ばれる比較的大規模かつ高難易度の新たなデータセット，およびオプティカルフロー推定という新たな画素ラベリング問題に適用し，提案手法が広く有用であることを確認した．具体的には，KITTIデータセットではおよそ6倍高速化した上でエラー率も10%低下した．オプティカルフロー推定ではおよそ19倍高速化しエラー率は1%低下した．この結果は国際論文誌に採択された．機械学習への応用に関しては，画素ラベリング問題の1つである意味領域分割のデータセット（PASCAL VOC 2012）を用いて実験を行ったところ，CNN単体と比較して精度が1.9%ほど向上した．また，類似したアイデアで条件付き確率場とCNNを統合学習する手法[Zheng, ICCV2015]と比較して，同程度の精度で2倍ほど高速であることを確認した．また，上記のCNNを用いた意味領域分割のマルチメディアにおける新たな応用として，インタラクティブな画像検索システムを提案した．ただCNNによる意味領域分割の結果を用いて画像検索するだけではなく，直積量子化を上手く組み合わせることで，検索精度をほぼ落とすことなく高速で省メモリな検索を可能にしている．従来のテキストベースの検索システムと提案システムを組み合わせることで，ユーザーが思い描いた画像をより正しく検索できるようになったことを主観評価実験にて確認した．この内容を国際会議にて発表も行った．
今後の研究の推進方策	現在，新たな学習方法として，世界で初めて強化学習を利用して画素ラベリング問題を解く研究を進めている．強化学習とは，従来の教師有り学習とは異なり，エージェントが試行錯誤を通して学習していく機械学習手法である．有名どころでは，囲碁においてプロの棋士を打ち負かしたGoogle DeepMindのAlphaGo[Silver, Nature2017]や，人間と遜色ないレベルでテレビゲームをプレイするDeep Q Network[Mnih, Nature2015]に代表されるように，強化学習は問題によっては教師有り学習では成しえなかった大きな成功を収める可能性を秘めている．私は強化学習を画像のノイズ除去の問題に適用し，最新の教師有り学習によるノイズ除去手法と同程度の性能を発揮することを実験にて確認した．さらにマルコフ確率場のように，近傍の画素への影響も考慮して強化学習を行う手法を提案し，精度が向上することも確認している．今後は画像の超解像などの，ノイズ除去以外の問題にも適用していく予定である．

研究成果
(3件)

すべて 2018 2017

すべて雑誌論文 (1件) (うち国際共著 1件、査読あり 1件、オープンアクセス 1件) 学会発表 (2件) (うち国際学会 1件)

[雑誌論文] Efficiency-Enhanced Cost-Volume Filtering featuring Coarse-to-Fine Strategy2017
- 著者名/発表者名
  Ryosuke Furuta, Satoshi Ikehata, Toshihiko Yamasaki, and Kiyoharu Aizawa
- 雑誌名
  
  Multimedia Tools and Applications
  
  巻: - ページ: -
- DOI
  https://doi.org/10.1007/s11042-017-4897-1
- 査読あり / オープンアクセス / 国際共著
[学会発表] Efficient and Interactive Spatial-Semantic Image Retrieval2018
- 著者名/発表者名
  Ryosuke Furuta, Naoto Inoue, and Toshihiko Yamasaki
- 学会等名
  The 24th International Conference on Multimedia Modeling (MMM)
- 国際学会
[学会発表] 意味領域分割に基づく効率的かつインタラクティブな画像検索2018
- 著者名/発表者名
  古田諒佑，井上直人，山崎俊彦
- 学会等名
  メディアエクスペリエンス・バーチャル環境基礎研究会 (MVE)

2017 年度 実績報告書

マルコフ確率場計算の効率化と機械学習への革新的応用

研究代表者

古田 諒佑 東京大学, 情報理工学系研究科, 特別研究員(DC1)

現在までの達成度 (区分)

理由

研究成果

[雑誌論文] Efficiency-Enhanced Cost-Volume Filtering featuring Coarse-to-Fine Strategy2017

著者名/発表者名

雑誌名

DOI

[学会発表] Efficient and Interactive Spatial-Semantic Image Retrieval2018

著者名/発表者名

学会等名

[学会発表] 意味領域分割に基づく効率的かつインタラクティブな画像検索2018

著者名/発表者名

学会等名

2017 年度実績報告書

古田諒佑東京大学, 情報理工学系研究科, 特別研究員(DC1)