研究課題/領域番号 |
16K00239
|
研究機関 | 広島大学 |
研究代表者 |
栗田 多喜夫 広島大学, 工学研究科, 教授 (10356941)
|
研究分担者 |
日高 章理 東京電機大学, 理工学部, 准教授 (70553519)
|
研究期間 (年度) |
2016-04-01 – 2021-03-31
|
キーワード | 画像認識 / 機械学習 / 人工知能 / 深層学習 |
研究実績の概要 |
本研究課題では,深層学習(Deep Learning),特に,Deep Convolutional Neural Network (DCNN)を用いることで画像認識の性能が飛躍的に向上した.その性能向上と適用領域をさらに拡大するために,申請者が過去に行ったニューラルネットワークに関する学習法に関する知見や脳の視覚情報処理に関する知見を取り入れた画像認識の研究を深層学習に拡張し,深層学習を用いた画像認識等の応用領域の拡大を目指す.今年度は,Siamese Networksを利用して2つの訓練サンプルから得られた特徴ベクトルを混合して学習に利用する特徴ベクトルベースのMix-up学習法やネットワークの出力の各ニューロンに判別基準を導入することで認識性能を向上させる手法を開発した.また,画像認識のために意味的な情報を付加する手法として,画像のアノテーション課題において不正確・不十分な教師ラベルでも学習可能とするため,ラベル間の共起情報をRestricted Boltzmann Machineを利用して学習し,学習したRestricted Boltzmann Machineを用いて不正確・不十分な教師ラベルから正確なラベル情報を予測し,予測したラベルを教師信号として学習に用いる手法を開発した.その他,感情の強さが陽に与えられていない表情が変化する顔を撮影した動画像から顔表情の感情の強さを推定するためのモデルを,Siamese NetworksやTriplet Networksを用いて学習する手法を開発した.これらの研究成果は,論文誌や国際会議論文として発表した.さらに,これまでの統計的パターン認識と判別分析に関するの研究成果をまとめて著書として出版した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
今年度に予定していた学習中のノイズの付加と中間層の表現に関する研究は,昨年度にほぼ終了しており,今年度は,深層学習の中間層の出力をスパースにするような制約を導入することで汎化性能の良いモデルが獲得する手法に関する研究成果を論文として発表した.今年度は,当初の研究計画では予定していなかった深層学習の性能向上と適用領域を拡大するための様々な課題に取り組んだ.まず,汎化性能の高い学習法として,2つの学習サンブルを混ぜ合わせて学習に利用するmix-upと呼ばれる手法を拡張子,CNNで学習した特徴ベクトルを混ぜ合わせる手法開発した.また,画像認識のために意味的な情報を付加する手法として,画像のアノテーション課題での不正確・不十分な教師ラベルでも学習可能とするため,ラベル間の共起情報をBoltzmann Machineを利用して学習することで,不完全なラベル情報を予測し,予測したラベルを学習に用いる手法を開発した.その他,応用として,Siamese Networksやtriplet networksを利用した顔表情から感情の強さを推定するモデルの学習法を開発した.また,化学データに基づいて結晶のChiralityを推定する手法,実時間のポーズ推定で得られたポースの時系列から動作を認識する手法,音楽の音情報から音程の階層構造を考慮した1次元の階層的Convolutional Neural Networksを用いて楽譜を推定する手法等を開発した.
|
今後の研究の推進方策 |
今年度に予定していた学習中のノイズの付加と中間層の表現に関する研究は,昨年度にほぼ終了しており,研究は比較的順調に進捗している.今年度は,当初の研究計画では予定していなかった深層学習の性能向上と適用領域を拡大するための様々な課題に取り組んだ.来年度は,画像中の対象の検出結果等のより意味的な情報を文脈として利用する手法についてさらに検討を深めたい.また,昨年度の開発したDeep Learningを用いた画像の超解像度手法を動画像やその他の画像処理に適用する研究にも取り組む予定である.
|
次年度使用額が生じた理由 |
国際会議ICPR2018への出張旅費として使用する予定であったが,講義等の都合で出席できなくなった.次年度に開催予定の国際会議(ICAN2019)の旅費として使用する予定である.
|