2015 Fiscal Year Annual Research Report
画像と言語を用いた質感情報表現のディープラーニング
Project Area | Understanding human recognition of material properties for innovation in SHITSUKAN science and technology |
Project/Area Number |
15H05919
|
Research Institution | Tohoku University |
Principal Investigator |
岡谷 貴之 東北大学, 情報科学研究科, 教授 (00312637)
|
Co-Investigator(Kenkyū-buntansha) |
山口 光太 東北大学, 情報科学研究科, 助教 (10742596)
|
Project Period (FY) |
2015-06-29 – 2020-03-31
|
Keywords | コンピュータビジョン / 深層学習 / 質感 / 画像認識 / 機械学習 |
Outline of Annual Research Achievements |
本研究の目的は,物体表面の質感を,その画像を入力にコンピュータが認識する画像認識システムを構築することにある.その達成へ向けて,当該年度に計画した研究項目は,大規模学習システムの構築,代理タスク選定とCNN構造設計,質感データセット構築の着手,言語埋め込み手法の理論検討,の4つある.第1の項目については,GPUサーバ2台を調達し,これを研究室で所有する同等のサーバと組み合わせてPCクラスタを構築し,深層学習が実験できる環境を構築した.次に第4の項目については,画像1枚の内容をCNNを用いて記述する2つの方法を開発した.それぞれ,国際会議ACL2016および国内会議MIRU2016に投稿中である.その他の項目については,当該分野での深層学習に関する研究開発のスピードが極めて早いことから,当初の研究の方向性を軌道修正する必要に迫られた.具体的には第2,3番目の項目については,当該年度中に発表された他の研究者による成果を利用することとし,本計画で実施を要しなかった.代わりに,特に質感とつながりの深い材質認識をターゲットに,物体認識からの転移学習の新たな方法を新たに開発した.また当領域での他の研究班との連携を考えて,生物視覚との関係性を最大限利用する必要性に思い至り,当該年度途中から研究に着手した.具体的には,材質認識におけるCNNの振る舞いと人視覚の振る舞いを比較する実験を行い,相違点および類似点を明らかにした.この成果は6月開催の国際会議VSS2016で報告予定である.また,以前より協力関係にある新潟大学医歯学研究科の協力を得て,サルの脳皮質電位図を用いた物体および素材認識の脳内機構の理解のための実験を行った.成果の一部はNeuroscience2016に投稿中であり,また国際ジャーナルへの投稿を準備中である.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当該分野での深層学習の研究のスピードが早く,当初計画内容の見直しを迫られたものの,新たに解決すべき課題を設定し直し,これに取り組んだことで,一定の成果を得ることができた為.
|
Strategy for Future Research Activity |
上の各項目で述べた要因,当該分野での深層学習の研究のスピードが著しく早く,未解決の問題のいくつかが解決され,新たな手法や道具が次々に開発されている.これにしたがって,計画立案時の当初計画は見直さざるを得ないが,逆に,以前はまだ難しいと思われた問題に取り組むことが可能になる面もある.このようなことから,常に最新の研究動向を踏まえつつ,当初目標である,質感を画像認識できるシステムの構築を目指し,柔軟に研究計画を軌道修正してゆくつもりである.
|
Research Products
(13 results)
-
-
-
-
-
-
-
-
-
[Presentation] 深層学習入門2015
Author(s)
岡谷貴之
Organizer
情報論的学習理論と機械学習(IBISML)
Place of Presentation
つくば国際会議場
Year and Date
2015-11-28
Invited
-
-
-
-