2005 Fiscal Year Annual Research Report
リフティングウェーブレットの識別機能を活用した大規模信号・画像からの意味獲得
Project/Area Number |
15300048
|
Research Institution | Kyushu University |
Principal Investigator |
新島 耕一 九州大学, 大学院・システム情報科学研究院, 教授 (30047881)
|
Co-Investigator(Kenkyū-buntansha) |
岡田 義広 九州大学, システム情報科学研究院, 助教授 (70250488)
葛目 幸一 弓削商船高専, 情報工学科, 教授 (80225151)
高野 茂 九州大学, システム情報科学研究院, 助手 (70336064)
|
Keywords | リフティングウェーブレット / 方向余弦最大化学習 / 分散最大化学習 / カートシス最小化学習 / 個人認証 / 対象物検出 / 表情認識 / 顔画像認識 |
Research Abstract |
今年度は、リフティングウェーブレットフィルタに識別機能をもたせるため、3種類の学習方式を提案した。 ひとつめは、対象画像の低周波成分ベクトルとリフティングウェーブレットフィルタを要素にもつベクトルの方向余弦を、最大にするような学習方式である(研究発表2)。この学習方式は、Newton法を採用しているため高速であり、かつ、ノイズに対して頑健である。したがって、1秒間に5フレーム程度のビデオフレームであればリアルタイムに学習でき、動画像にも対応できる。実際に、この学習方式を用いて、ビデオフレーム中の目、鼻、口などの顔部分に対して学習を行い、高速で高精度に個人認証を行うことができた。 二つめは、対象画像の高周波成分をリフティングし、その分散を最大にする学習方式で、学習されたフィルタを用いると、たとえば開いた目だけを高速に抽出できる。この研究成果は、一流のウェーブレット研究者が集うシンポジウムSPARS2005において発表され、好評であった(研究発表13)。 三つめは、4次の統計量(カートシス)を最小にする学習方式で、この方式により学習されたフィルタを用いると、たとえば、笑ったときの目や口を瞬時に検出でき、表情認識が可能となる。研究成果は、今年2月に開催されたVISAPP2006においてFull paperとして発表された(研究発表16)。 研究発表14は、円形度を用いた画像のレイヤー化とグラフツリーの学習に基づいた画像検索の研究であり、研究発表15は、拡張Haarフィルタの新しい学習方式とそれによる顔画像認識に関する研究である。 残りの研究成果は、意味獲得を3次元物体に拡張するための準備であり、最終年度に当たる平成18年度には、3次元物体からの意味獲得に関する研究も行う予定である。
|
Research Products
(19 results)