研究課題/領域番号 |
17206030
|
研究種目 |
基盤研究(A)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
電子・電気材料工学
|
研究機関 | 東京大学 |
研究代表者 |
柴田 直 東京大学, 大学院・工学系研究科, 教授 (00187402)
|
研究分担者 |
三田 吉郎 東京大学, 大学院・工学系研究科, 准教授 (40323472)
|
研究期間 (年度) |
2005 – 2007
|
研究課題ステータス |
完了 (2007年度)
|
配分額 *注記 |
47,450千円 (直接経費: 36,500千円、間接経費: 10,950千円)
2007年度: 11,960千円 (直接経費: 9,200千円、間接経費: 2,760千円)
2006年度: 18,200千円 (直接経費: 14,000千円、間接経費: 4,200千円)
2005年度: 17,290千円 (直接経費: 13,300千円、間接経費: 3,990千円)
|
キーワード | ブレインプロセッサー / CMOSイメージセンサー / 動きフィールド生成 / 方向性エッジ検出 / 画像認識 / ジェスチャー認識 / エゴモーション認識 / 物体追跡 / VLSI / 生体情報処理 / 動き場生成 / 動作認識 / ego-motion認識 / 動きベクトル検出 / エッヂ情報 / ego motion detection / 動き検出 / ジェスチャー理解 / VLSIシステム / 隠れマルコフモデル / Principal Motion Distribution / エッジ検出フィルター / 動きの認識 / 動画像処理 / CMOSイメージセンサ / Ego-Motion Detection / 時間領域演算回路 / 心理学的脳モデル |
研究概要 |
過去に経験した最もよく似た事例の連想・想起により、人間は迅速かつ柔軟にものごとの認識・判断を行っているという「連想原理」に基づき、我々はこれまで脳の機能を模擬した知能VLSIシステムの開発を行ってきた。本研究の主眼は、これまでの静止画像の認識に加え、さらに動画像の意味を理解できるシステム構築の基礎技術確立である。“What is it?"をさらに一歩進め、“What is it doing?"の認識を可能にするシステム高機能化の研究である。動きの理解には、先ず動画像から動きの情報を抽出し、それを特徴ベクトル表現に変換することが必須である。そのため、実時間の動き場生成VLSIプロセッサを新たな回路方式で実現した。アナログVLSIでは、時間領域演算に基づく新たなハードウェアアルゴリズムを導入し、500fpsでのnormal optical flow生成可能なCMOSイメージセンサを開発した。またデジタルVLSIでは、方向性エッジ情報を用いたブロックマッチング法を新規開発し、これにより超高速の高精度動きフィールド生成に成功した。このチップは、2.8GHzCPUを用いたソフトウェア処理と比較して、たった100分の1の遅い周波数動作で1000倍以上高速の高密度動きフィールド生成を実現した。また各瞬間の動きフィールドをコンパクトに表現する動き成分空間分布ヒストグラム(PPMD)ベクトル、さらにPPMDベクトルを時間的・空間的に積分してあるアクション全体を表現するMotion History Vector等のアルゴリズムを開発、前者は隠れマルコフモデルを用いて認識を行い、後者は従来の連想マッチングで認識を行う。これらのアルゴリズムにより、エゴモーションの認識、簡単なジェスチャーの認識、さらに動き物体の追跡がロバストに行えることを実証した。
|