2006 年度実績報告書

動画像のアピアランスモデルとその応用に関する研究

研究課題

研究課題/領域番号	16760293
研究機関	電気通信大学
研究代表者	長井隆行電気通信大学, 大学院電気通信学研究科, 助教授 (40303010)
キーワード	アピアランスモデル / 2次元隠れマルコフモデル / モデルベース符号化 / 顔アニメーション
研究概要	本研究は、動画像表現の新たな枠組みを開発することを目的としている。このためにまず、2次元隠れマルコフモデル(2DHMM)を用いた画像のアピアランスモデルを構築する。このような動画像のモデルを用いることで、オブジェクトの3次元形状の推定や、2次元画像からのパラメータの抽出といった困難な問題を回避することができると考えられる。一昨年度、昨年度はアピアランスモデルの基本的な枠組みを構築し、要素技術の開発を行った。また、昨年度は開発した要素技術の高精度化、応用について検討した。これを踏まえて本年度は、こうした技術の更なる応用について検討した。 1.アピアランスモデルの顔アニメーションヘの応用提案法は、モデルベース符号化であるため、符号化と復号化で用いるモデルを変えることで面白い効果を生み出すことができると考えられる。そこで昨年度、アピアランスモデルの一つの応用として、ある人の顔を他人の顔に変換して顔アニメーションを行うことを検討した。実際にビデオカメラの前で表情を変えたり発話すると、画面上ではあたかも他の人が表情を変えたり、発話するような効果を得ることが可能となった。しかしこの段階では計算量が多く、リアルタイムでこれを行うことはできなかった。今年度は、アルゴリズムの高速化を行い、リアルタイムでの実現を可能とした。また、状態系列とモデルの符号化手法を併用することで、ネットワークを介した顔変換を実現することが可能となった。 2.ロボットによる概念の獲得におけるアピアランスモデルの利用昨年度、アピアランスモデルを応用し、様々な物体の外見や文字を学習するシステムを検討した。また、実際にロボットに実装することで、見た物体を教師なしかつオンラインで学習することが可能となった。これは、アピアランスモデルの自動的なクラスタリングに基づいている。今年度はこれに基づき、さらに上位の概念を獲得する手法を検討し、ロボット上に実装することでその有効性を確かめた。具体的には、まず、視覚的情報をアピアランスモデルを用いて表現し、機能を対象物の変化ベクトルを用いて表現した。その上でこれらを確率モデルを用いて関連付けることで上位の物体概念を形成する計算モデルを提案し、実装した。これによりロボットが、はさみやカッターといった道具の概念を獲得し、その機能を予測することが可能となった。

研究成果
(8件)

すべて 2007 2006

すべて雑誌論文 (7件) 産業財産権 (1件)

[雑誌論文] ベイジアンネットワークによる物体の概念モデル2007
- 著者名/発表者名
  佐藤陽介, 長井隆行
- 雑誌名
  
  2007年電子情報通信学会総合大会講演論文集(情報・システム) D-12-77
  
  ページ: 193
[雑誌論文] 物体のマルチモーダルカテゴリゼーション2006
- 著者名/発表者名
  長井隆行, 岩橋直人
- 雑誌名
  
  情報科学技術レターズ2006 vol. 5
  
  ページ: 183-186
[雑誌論文] 人間の行動モデルの生成と行動予測への応用2006
- 著者名/発表者名
  安居健, 長井隆行
- 雑誌名
  
  第21回信号処理シンポジウム講演論文集 Ba-2(CD-ROM)
  
  ページ: 1-6
[雑誌論文] 複数のステレオペアを用いた高解像度画像と高精度三次元情報の同時推定2006
- 著者名/発表者名
  木村一人, 長井隆行, 永吉洋登, 酒匂裕
- 雑誌名
  
  第21回信号処理シンポジウム講演論文集 B8-3(CD-ROM)
  
  ページ: 1-6
[雑誌論文] Object Categorization Using Multimodal Information2006
- 著者名/発表者名
  Takayuki Nagai, Naoto Iwahashi
- 雑誌名
  
  Proc of IEEE Ten Region Conference (TENCON2006) C10.2 (CD-RON)
  
  ページ: 1-4
[雑誌論文] Learning of Object Concept Through Function and Shape2006
- 著者名/発表者名
  Yosuke Sato, Takayuki Nagai
- 雑誌名
  
  Proc of IEEE Ten Region Conference (TENCON2006) TEN-477(CD-RON)
  
  ページ: 1-4
[雑誌論文] Blind Source Separation Using Correlation at Neighboring Frequencies2006
- 著者名/発表者名
  Rintaro Sukegawa, Shinya Uchida, Takayuki Nagai, Masaaki Ikehara
- 雑誌名
  
  Proc of 2006 International Symposium on Intelligent Signal Processing and Communication Systems TAM1-2-1
  
  ページ: 451-454
[産業財産権] 物体認識システム、物体認識方法及び物体認識ロボット2006
- 発明者名
  長井, 佐藤, 細井
- 権利者名
  長井, 佐藤, 細井
- 産業財産権番号
  特願 2006-308237
- 出願年月日
  2006-11-14

2006 年度 実績報告書

動画像のアピアランスモデルとその応用に関する研究

研究代表者

長井 隆行 電気通信大学, 大学院電気通信学研究科, 助教授 (40303010)

研究成果

[雑誌論文] ベイジアンネットワークによる物体の概念モデル2007

著者名/発表者名

雑誌名

[雑誌論文] 物体のマルチモーダルカテゴリゼーション2006

著者名/発表者名

雑誌名

[雑誌論文] 人間の行動モデルの生成と行動予測への応用2006

著者名/発表者名

雑誌名

[雑誌論文] 複数のステレオペアを用いた高解像度画像と高精度三次元情報の同時推定2006

著者名/発表者名

雑誌名

[雑誌論文] Object Categorization Using Multimodal Information2006

著者名/発表者名

雑誌名

[雑誌論文] Learning of Object Concept Through Function and Shape2006

著者名/発表者名

雑誌名

[雑誌論文] Blind Source Separation Using Correlation at Neighboring Frequencies2006

著者名/発表者名

雑誌名

[産業財産権] 物体認識システム、物体認識方法及び物体認識ロボット2006

発明者名

権利者名

産業財産権番号

出願年月日

2006 年度実績報告書

長井隆行電気通信大学, 大学院電気通信学研究科, 助教授 (40303010)