研究課題
研究実績は以下の二点に要約される。一点目はグラフ信号処理を用いた画像復元問題の適応。二点目はビデオ会議システム用の視線矯正と顔の美化。一点目に関しては、最近信号処理学会で注目を集めているグラフ信号処理(graph signal processing (GSP))のツールの一つ、graph Fourier transform (GFT)を用いて、画像のノイズ除去や補間などの画像復元問題(image restoration problems)に適応する研究を行った。まず適切なエッジウェイトを与えて、graph Laplacianを計算する。グラフ信号xに対して、graph smoothness priorを用いて、信号の復元が可能になる。この手法は画像のノイズ除去、bit-depthの高度化、画像の補間などに適応し、その成果はIEEE会議で発表した。二点目に関しては、一般的なテレビ会議システムで撮影するカメラの位置がユーザーの注目点と違うことにより、会議の参加者たちの視線が合わない問題に対する解決方法を提案した。まずネットから入手した20代から40代までの芸能人の顔写真を機械学習し、信号の辞書(dictionary)を作成する。テレビ会議の時には、スクリーンの真ん中の視点からの画像を合成し、辞書のatomsを用いてスパースな表現を求める。結果は視線矯正した画像だけでなく、目や眉毛が美化された効果が見られる。その成果はIEEE会議で発表した。
2: おおむね順調に進展している
GFTを用いた、画像のノイズ除去、bit-depthの高度化、画像の補間もIEEE会議で発表することになった。奥行き画像の圧縮は4月にIEEEジャーナルに投稿した。テレビ会議用の視線矯正と顔の美化は二月にIEEE会議に投稿した。最初のバージョンを改善し、四月にIEEEジャーナルに投稿した。
GFTのグラフ構成は画像復元の効果に大きく影響する。論理的に一番適切なグラフ構成はどう求められるかは現在検討している最中。顔の美化に関しては、実際のテレビ会議システムに適応するために、アルゴリズムのスピードアップが必要と指摘されている。アルゴリズムの簡潔化とGPUの実装を検討する予定。
奥行き画像の符号化アルゴリズムの圧縮に伴う計算過程に予想以上の時間がかかることが分かり、アルゴリズムのスピードアップの調整をする必要が生じ、システムの開発が遅れたため。システム開発の遅れを取り戻すための機械学習が専門のポストドクターを雇用する人件費及び、研究成果発表のための学会参加費、旅費として使用する。
すべて 2014 2013 その他
すべて 雑誌論文 (6件) (うち査読あり 6件、 謝辞記載あり 1件) 学会発表 (8件) (うち招待講演 1件) 備考 (1件)
IEEE Transactions on Multimedia
巻: vol.16, no.3, April ページ: pp.711-725
10.1109/TMM.2014.2299768
IEEE Transactions on Circuits and Systems for Video Technology
巻: vol.23, no.10, October ページ: pp.1781-1794
10.1109/TCSVT.2013.2269019
巻: vol.15, no.8, December ページ: pp.1865-1879
10.1109/TMM.2013.2272918
巻: vol.15, no.8, December ページ: pp.2099-2113
10.1109/TMM.2013.2281024
IEEE Signal Processing Letters
巻: vol.20, no.10, October ページ: pp.972-975
10.1109/LSP.2013.2277595
IEEE Transactions on Image Processing
巻: vo.22, no.9, September ページ: pp.3459-3472
10.1109/TIP.2013.2270183
http://research.nii.ac.jp/~cheung/index.html