2010 Fiscal Year Annual Research Report

直感的に雰囲気を察知し、瞬時に知覚情報の記述・構造化を行う実世界知能ロボット

Research Project

Project/Area Number	08J10445
Research Institution	The University of Tokyo
Principal Investigator	中山英樹東京大学, 大学院・情報理工学系研究科, 特別研究員(DC1)
Keywords	大規模一般画像認識 / 距離計量学習 / 線形性
Research Abstract	制約のない実世界の画像を計算機に認識させ,言語により記述させる技術を一般画像認識と呼ぶ.我々人間も外界の多くの情報を視覚から認識し行動決定を行っているように,本研究の研究課題である知能ロボットにおいても一般画像認識は必要不可欠な機能の一つであるといえる.一般画像認識は,扱う画像や認識対象が多種多様であるため,極めて難しいタスクであると認知されている.汎用性の高い一般画像認識を実現するためには,大量の事例データからの統計学習が鍵となる.しかしながら,従来の手法は学習サンプル数に対するスケーラビリティを欠いていたため,大規模な画像コーパスを用いて学習・認識を行うことは著しく困難であった. 本年度は,これまでに開発した技術の統合を行い,大規模一般画像認識のための数理的枠組みを完成させた.さらに,実際に1200万枚の画像データベースを用いた評価実験により,その有効性を確認した.例えば,学習サンプル数を増やすほど認識可能な語彙数が増え,個々の画像に対するラベルづけの精度も向上する.特に,本研究で提案したGLCと呼ばれる画像特徴量や,CCDと呼ばれる距離計量学習手法が有効である。その他にも多くの重要な知見を得ており,これらを博士論文へまとめた. 本研究で完成された数理的理論体系は,提案手法に限らない汎用的なものであるため,大規模一般画像認識技術の発展に大きく貢献することが期待される.対外発表においても,4件の査読付き論文誌に加え,画像認識における最高峰の国際会議であるCVPR, BMVCに採択されるなど高く評価されている.また,最先端の研究機関が参加する著名な画像認識コンペティションにおいて,世界第3位の認識性能を達成した.

Research Products

(7 results)

All 2010 Other

All Journal Article (4 results) (of which Peer Reviewed: 4 results) Presentation (2 results) Remarks (1 results)

[Journal Article] 大規模Web画像のための画像アノテーション・リトリーバル手法2010
- Author(s)
  中山英樹, 原田達也, 國吉康夫
- Journal Title
  
  電子情報通信学会論文誌
  
  Volume: Vol.J93-D, No.8 Pages: 1267-1280
- Peer Reviewed
[Journal Article] Dense Sampling Low-Level Statistics of Local Features2010
- Author(s)
  Hideki Nakayama, Tatsuya Harada, Yasuo Kuniyoshi
- Journal Title
  
  IEICE Transactions on Information and Systems
  
  Volume: Vol.E93-D, No.7 Pages: 1727-1736
- Peer Reviewed
[Journal Article] Image Annotation and Retrieval for Weakly Labeled Images using Conceptual Learning2010
- Author(s)
  Tatsuya Harada, Hideki Nakayama, Yasuo Kuniyoshi, Nobuyuki Otsu
- Journal Title
  
  Journal of New Generation Computing
  
  Volume: Vol.28, No.3 Pages: 277-298
- Peer Reviewed
[Journal Article] AI Goggles :追加学習機能を備えたウェアラブル画像アノテーション・リトリーバルシステム2010
- Author(s)
  原田達也, 中山英樹, 國吉康夫
- Journal Title
  
  電子情報通信学会論文誌
  
  Volume: Vol.J93-D, No.6 Pages: 857-869
- Peer Reviewed
[Presentation] Evaluation of Dimensionality Reduction Methods for Image Auto-Annotation2010
- Author(s)
  Hideki Nakayama
- Organizer
  British Machine Vision Conference
- Place of Presentation
  Aberystwyth, UK
- Year and Date
  2010-09-01
[Presentation] Global Gaussian Approach for Scene Categorization Using Information Geoemtry2010
- Author(s)
  Hideki Nakayama
- Organizer
  IEEE Conference on Computer Vision and Pattern Recognition
- Place of Presentation
  San Francisco, USA
- Year and Date
  2010-06-16
[Remarks]
- URL
  http://www.isi.imi.i.u-tokyo.ac.jp/~nakayama/index.html

2010 Fiscal Year Annual Research Report

直感的に雰囲気を察知し、瞬時に知覚情報の記述・構造化を行う実世界知能ロボット

Principal Investigator

中山 英樹 東京大学, 大学院・情報理工学系研究科, 特別研究員(DC1)

Research Products

[Journal Article] 大規模Web画像のための画像アノテーション・リトリーバル手法2010

Author(s)

Journal Title

[Journal Article] Dense Sampling Low-Level Statistics of Local Features2010

Author(s)

Journal Title

[Journal Article] Image Annotation and Retrieval for Weakly Labeled Images using Conceptual Learning2010

Author(s)

Journal Title

[Journal Article] AI Goggles :追加学習機能を備えたウェアラブル画像アノテーション・リトリーバルシステム2010

Author(s)

Journal Title

[Presentation] Evaluation of Dimensionality Reduction Methods for Image Auto-Annotation2010

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] Global Gaussian Approach for Scene Categorization Using Information Geoemtry2010

Author(s)

Organizer

Place of Presentation

Year and Date

[Remarks]

URL

中山英樹東京大学, 大学院・情報理工学系研究科, 特別研究員(DC1)