2016 Fiscal Year Annual Research Report
マルコフ確率場計算の効率化と機械学習への革新的応用
Project/Area Number |
16J07267
|
Research Institution | The University of Tokyo |
Principal Investigator |
古田 諒佑 東京大学, 大学院情報理工学系研究科, 特別研究員(DC1)
|
Project Period (FY) |
2016-04-22 – 2019-03-31
|
Keywords | マルコフ確率場 |
Outline of Annual Research Achievements |
平成28年度は、私の研究課題について、「マルコフ確率場計算の効率化」と「機械学習への応用」の2つに分けて研究を進めた。以下にその研究実施状況について報告する。 ・マルコフ確率場計算の効率化 効率化の研究に関しては、申請書の「現在までの研究状況」の欄で述べたように、特別研究員採用開始時点で既に提案手法が完成していたため、平成28年度は追加実験と国内・国際会議での発表を中心に研究を進めた。また、会議で発表した内容を発展させ、IEEE英文論文誌に投稿し、採録されるなどの成果が得られた。 ・機械学習への応用 機械学習への応用に関しては、申請書の「これからの研究計画」の欄で述べたように、まずマルコフ確率場を基に、マルチラベル分類と特徴融合の2つの問題を統一的に扱うことのできるモデルを提案した。このモデルを、動画の印象推定と画像のアトリビュート推定の2つのタスクに応用し、推定精度の向上が確認できた。また、このモデルを高階マルコフ確率場に拡張し、その結果、ラベルのペアの共起確率のみを考慮する場合より柔軟な、3つ以上のラベルの共起確率を扱うことができるようになった。同上の2つのタスクにおける実験にてさらなる推定精度向上が確認でき、査読あり国際会議に採択され発表を行った。さらに、まだ着想段階ではあるが、上記のマルコフ確率場のモデルを、現在機械学習の分野において主流となっている畳み込みニューラルネットワークの1部として組み込むことを検討している。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
効率化の研究に関しては、申請書の「現在までの研究状況」の欄で述べたように、特別研究員採用開始時点で既に提案手法が完成していたため、平成28年度は追加実験と発表を中心に研究を進めた。具体的には、平成27年1月に投稿済みであった査読あり国際会議に採択されたため、平成28年9月に発表を行い、海外の研究者と議論を重ね有用なアドバイスを貰った。また、国内の研究者にも私の研究内容を認知してもらうため、平成28年8月に国内会議での発表も行った。さらに、提案手法の有用性を主張するための追加実験の結果(クラウドソーシングを用いた大規模主観評価実験や実験結果の統計的優位性の主張)を加え、発展させた論文を査読あり国際論文誌に投稿し、採択された。このように、効率化の研究に関しては、主に業績の面で大きな成果が得られたと考えている。 機械学習への応用に関しては、申請書の段階では予備実験までしかできていなかったが、追加実験を行い、提案手法の有用性を確認することができた。また、このモデルを高階マルコフ確率場に拡張し、その結果、ペアのみを考慮する場合より柔軟な、3つ以上のラベルの共起確率を扱うことができるようになった。同上の2つのタスクにおける実験にてさらなる推定精度向上が確認でき、査読あり国際会議に採択され発表を行った。このように、機械学習への応用に関しても、手法の拡張、実験結果、業績という面で順調に進展していると考えている。
|
Strategy for Future Research Activity |
これまでの提案手法では、識別器とマルコフ確率場は独立しており、同時にパラメータ学習することができないという問題があった。そこで現在、提案するマルコフ確率場のモデルを、畳み込みニューラルネットワーク(CNN)の一部として組み込むことを検討している。CNNは現在画像認識の分野において、最も良い性能を発揮している識別器である。不動点反復法でマルコフ確率場を最適化する場合に、再帰的な畳み込み計算と数学的に一致することは導出済みである。識別器としてCNNを用いることで、理論的には逆誤差伝搬により、マルコフ確率場と同時にパラメータ学習をすることができる。さらに畳み込み演算はGPU上で非常に高速に行うことが可能であるため、計算時間も大きく効率化される。このモデルを画像の意味領域分割問題に応用し、PASCAL VOCと呼ばれるデータセットを用いて実験を行った。画像の意味領域分割問題は、各画素にラベルをふるマルチラベル分類の1種として考えることができる。しかし、現在のところパラメータ学習が上手くいっておらず、精度向上は確認できていない。CNNには、層の数やカーネルサイズやストライド、学習率やモーメンタムなどある程度経験的に手動で調整する必要のあるハイパーパラメータが多数存在するので、それらの調整不足が原因の1つとして考えられる。今後の予定としては、それらのハイパーパラメータを調整しながら学習を繰り返し行い、この原因の究明に取り組んでいく。また、意味領域分割以外の問題、例えば画像の奥行き推定やオプティカルフロー推定などの問題にも適用していく予定である。
|