2017 Fiscal Year Annual Research Report
Construction of a theory deriving super-versatility cross-media bases for breaking limitations in various image processing fields
Project/Area Number |
15K12023
|
Research Institution | Hokkaido University |
Principal Investigator |
長谷山 美紀 北海道大学, 情報科学研究科, 教授 (00218463)
|
Co-Investigator(Kenkyū-buntansha) |
小川 貴弘 北海道大学, 情報科学研究科, 准教授 (20524028)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | マルチメディア情報処理 |
Outline of Annual Research Achievements |
本研究は、画像処理の諸分野において精度限界を打破する超汎用メディア横断型基底導出理論の構築を目指し、研究期間内に【フェーズ1】「異種メディアの統合解析によるメディア横断型基底の導出」、【フェーズ2】「非線形処理を導入したメディア横断型基底の高度化」、【フェーズ3】「メディア横断型基底の工学的応用による画像処理諸分野の精度限界の向上」の実現を目指している。前年度までに、画像中の「撮像内容」、すなわち、意味理解が可能となった画像中の各領域に対して高精度な近似を可能とするメディア横断型基底の導出を行ってきた。平成29年度は、本研究で構築されるメディア横断型基底を、これまでの画像符号化・復元で「画像の近似」に用いられてきた基底に置き換えることで、各分野においてその精度限界の向上が可能になることを示した。また、メディア横断型基底は、「意味理解」を同時に実現する基底であることから、これを用いることで、画像中の「撮像内容」の推定が可能となり、画像認識・検索・推薦の分野においてもその精度限界の向上を実現した。従来より、画像の符号化、復元、認識、検索・推薦等の分野では、直交変換や部分空間法等、基底の導出によって実現される研究が数多く提案されている。また、これらの研究における精度は、導出される基底に大きく依存する。本研究で導出する「画像の近似」と「意味理解」を同時に実現するメディア横断型基底は、「撮像内容」に注目しながら、最適に画像を近似できることから、今後極めて広い分野に対して超汎用的に応用可能であり、その精度向上が期待できる。また、本研究では、画像だけでなく、音楽・音響・映像処理を含むマルチメディア信号処理の広い分野において成果の創出が可能になり、マルチメディア処理の諸分野においてブレークスルーを与えることを明らかにした。
|
Research Products
(27 results)