2018 年度実施状況報告書

画像認識のための文脈とトップダウン情報を利用した中間表現の獲得に関する研究

研究課題

研究課題/領域番号	16K00239
研究機関	広島大学
研究代表者	栗田多喜夫広島大学, 工学研究科, 教授 (10356941)
研究分担者	日高章理東京電機大学, 理工学部, 准教授 (70553519)
研究期間 (年度)	2016-04-01 – 2021-03-31
キーワード	画像認識 / 機械学習 / 人工知能 / 深層学習
研究実績の概要	本研究課題では，深層学習(Deep Learning)，特に，Deep Convolutional Neural Network (DCNN)を用いることで画像認識の性能が飛躍的に向上した．その性能向上と適用領域をさらに拡大するために，申請者が過去に行ったニューラルネットワークに関する学習法に関する知見や脳の視覚情報処理に関する知見を取り入れた画像認識の研究を深層学習に拡張し，深層学習を用いた画像認識等の応用領域の拡大を目指す．今年度は，Siamese Networksを利用して2つの訓練サンプルから得られた特徴ベクトルを混合して学習に利用する特徴ベクトルベースのMix-up学習法やネットワークの出力の各ニューロンに判別基準を導入することで認識性能を向上させる手法を開発した．また，画像認識のために意味的な情報を付加する手法として，画像のアノテーション課題において不正確・不十分な教師ラベルでも学習可能とするため，ラベル間の共起情報をRestricted Boltzmann Machineを利用して学習し，学習したRestricted Boltzmann Machineを用いて不正確・不十分な教師ラベルから正確なラベル情報を予測し，予測したラベルを教師信号として学習に用いる手法を開発した．その他，感情の強さが陽に与えられていない表情が変化する顔を撮影した動画像から顔表情の感情の強さを推定するためのモデルを，Siamese NetworksやTriplet Networksを用いて学習する手法を開発した．これらの研究成果は，論文誌や国際会議論文として発表した．さらに，これまでの統計的パターン認識と判別分析に関するの研究成果をまとめて著書として出版した．
現在までの達成度 (区分)	現在までの達成度 (区分) 1: 当初の計画以上に進展している理由今年度に予定していた学習中のノイズの付加と中間層の表現に関する研究は，昨年度にほぼ終了しており，今年度は，深層学習の中間層の出力をスパースにするような制約を導入することで汎化性能の良いモデルが獲得する手法に関する研究成果を論文として発表した．今年度は，当初の研究計画では予定していなかった深層学習の性能向上と適用領域を拡大するための様々な課題に取り組んだ．まず，汎化性能の高い学習法として，2つの学習サンブルを混ぜ合わせて学習に利用するmix-upと呼ばれる手法を拡張子，CNNで学習した特徴ベクトルを混ぜ合わせる手法開発した．また，画像認識のために意味的な情報を付加する手法として，画像のアノテーション課題での不正確・不十分な教師ラベルでも学習可能とするため，ラベル間の共起情報をBoltzmann Machineを利用して学習することで，不完全なラベル情報を予測し，予測したラベルを学習に用いる手法を開発した．その他，応用として，Siamese Networksやtriplet networksを利用した顔表情から感情の強さを推定するモデルの学習法を開発した．また，化学データに基づいて結晶のChiralityを推定する手法，実時間のポーズ推定で得られたポースの時系列から動作を認識する手法，音楽の音情報から音程の階層構造を考慮した1次元の階層的Convolutional Neural Networksを用いて楽譜を推定する手法等を開発した．
今後の研究の推進方策	今年度に予定していた学習中のノイズの付加と中間層の表現に関する研究は，昨年度にほぼ終了しており，研究は比較的順調に進捗している．今年度は，当初の研究計画では予定していなかった深層学習の性能向上と適用領域を拡大するための様々な課題に取り組んだ．来年度は，画像中の対象の検出結果等のより意味的な情報を文脈として利用する手法についてさらに検討を深めたい．また，昨年度の開発したDeep Learningを用いた画像の超解像度手法を動画像やその他の画像処理に適用する研究にも取り組む予定である．
次年度使用額が生じた理由	国際会議ICPR2018への出張旅費として使用する予定であったが，講義等の都合で出席できなくなった．次年度に開催予定の国際会議（ICAN2019）の旅費として使用する予定である．

研究成果
(12件)

すべて 2019 2018

すべて雑誌論文 (5件) (うち国際共著 2件、査読あり 5件、オープンアクセス 3件) 学会発表 (6件) (うち国際学会 6件) 図書 (1件)

[雑誌論文] Deep Packet Flow : Action recognition via multiresolution deep wavelet packet of local dense optical flows2019
- 著者名/発表者名
  Novanto Yudistira and Takio Kurita
- 雑誌名
  
  The Journal of Signal Processing Systems for Signal, Image, and Video Technology
  
  巻: 91 ページ: 609-625
- DOI
  https://doi.org/10.1007/s11265-018-1363-x
- 査読あり / 国際共著
[雑誌論文] Logistic regression analysis for the material design of chiral crystals2018
- 著者名/発表者名
  Shimono, Eri; Inoue, Katsuya; Kurita, Takio; Ichiraku, Yoji
- 雑誌名
  
  Chemistry Letters
  
  巻: 47 ページ: 611-612
- DOI
  10.1246/cl.171233
- 査読あり / オープンアクセス
[雑誌論文] CNNにおけるRｅＬＵ活性化関数に対するスパース正則化の適用と分析2018
- 著者名/発表者名
  井手秀徳，栗田多喜夫
- 雑誌名
  
  電子情報通信学会論文誌
  
  巻: J101-D ページ: 1110-1119
- DOI
  10.14923/transinfj.2017IUP0005
- 査読あり
[雑誌論文] Facial Expression Intensity Estimation using Siamese and triplet networks2018
- 著者名/発表者名
  Motaz Sabri and Takio Kurita
- 雑誌名
  
  Neurocomputing
  
  巻: 313 ページ: 143-154
- DOI
  10.1016/j.neucom.2018.06.054
- 査読あり / オープンアクセス / 国際共著
[雑誌論文] Mixture of Counting CNNs2018
- 著者名/発表者名
  Shohei Kumagai, Kazuhiro Hotta, and Takio Kurita
- 雑誌名
  
  Machine Vision and Applications
  
  巻: 29 ページ: 1119--1126
- DOI
  10.1007/s00138-018-0955-6
- 査読あり / オープンアクセス
[学会発表] Texture Segmentation using Siamese Network and Hierarchical Region Merging2018
- 著者名/発表者名
  Ryusuke Yamada, Hidenori Ide, Novanto Yudistira, and Takio Kurita
- 学会等名
  he 24th International Conference on Pattern Recognition in Beijing, China, August 2018 (ICPR2018)
- 国際学会
[学会発表] Convolutional Neural Network with Discriminant Criterion for Input of each Neuron in Output Layer2018
- 著者名/発表者名
  Hidenori Ide and Takio Kurita
- 学会等名
  25th International Conference on Neural information Processing (ICONIP2018)
- 国際学会
[学会発表] Mixup of Feature Maps in a Hidden Layer for Training of Convolutional Neural Network2018
- 著者名/発表者名
  Hideki Oki and Takio Kurita
- 学会等名
  25th International Conference on Neural information Processing (ICONIP2018)
- 国際学会
[学会発表] 3D Region Merging for Segmentation of Teeth on Cone-Beam Computed Tomography Images2018
- 著者名/発表者名
  Rarasmaya Indraswari, Takio Kurita, Agus Zainal Arifin, Nanik Suciati, Eha Renwi Astuti and Dini Adni Navastara
- 学会等名
  Joint 10th International Conference on Soft Computing and Intelligent Systems (SCIS-ISIS2018)
- 国際学会
[学会発表] Music score estimation algorithm using octave hierarchy defined on logarithmic frequency2018
- 著者名/発表者名
  Ziang Ye, Muthusubash Kavitha, Junichi Miyao and Takio Kurita
- 学会等名
  25th International Workshop on Frontiers of Computer Vision (IW-FCV2019),
- 国際学会
[学会発表] Action Classfication Based on 2D Coordinates Obtained by Real-time Pose Estimation2018
- 著者名/発表者名
  Siyi Shuai, Muthusubash Kavitha, Junichi Miyao and Takio Kurita
- 学会等名
  25th International Workshop on Frontiers of Computer Vision (IW-FCV2019)
- 国際学会
[図書] 統計的パターン認識と判別分析2019
- 著者名/発表者名
  栗田多喜夫，日高章理
- 総ページ数
  236
- 出版者
  コロナ社
- ISBN
  978-4-339-02831-7

2018 年度 実施状況報告書

画像認識のための文脈とトップダウン情報を利用した中間表現の獲得に関する研究

研究代表者

栗田 多喜夫 広島大学, 工学研究科, 教授 (10356941)

現在までの達成度 (区分)

理由

研究成果

[雑誌論文] Deep Packet Flow : Action recognition via multiresolution deep wavelet packet of local dense optical flows2019

著者名/発表者名

雑誌名

DOI

[雑誌論文] Logistic regression analysis for the material design of chiral crystals2018

著者名/発表者名

雑誌名

DOI

[雑誌論文] CNNにおけるRｅＬＵ活性化関数に対するスパース正則化の適用と分析2018

著者名/発表者名

雑誌名

DOI

[雑誌論文] Facial Expression Intensity Estimation using Siamese and triplet networks2018

著者名/発表者名

雑誌名

DOI

[雑誌論文] Mixture of Counting CNNs2018

著者名/発表者名

雑誌名

DOI

[学会発表] Texture Segmentation using Siamese Network and Hierarchical Region Merging2018

著者名/発表者名

学会等名

[学会発表] Convolutional Neural Network with Discriminant Criterion for Input of each Neuron in Output Layer2018

著者名/発表者名

学会等名

[学会発表] Mixup of Feature Maps in a Hidden Layer for Training of Convolutional Neural Network2018

著者名/発表者名

学会等名

[学会発表] 3D Region Merging for Segmentation of Teeth on Cone-Beam Computed Tomography Images2018

著者名/発表者名

学会等名

[学会発表] Music score estimation algorithm using octave hierarchy defined on logarithmic frequency2018

著者名/発表者名

学会等名

[学会発表] Action Classfication Based on 2D Coordinates Obtained by Real-time Pose Estimation2018

著者名/発表者名

学会等名

[図書] 統計的パターン認識と判別分析2019

著者名/発表者名

総ページ数

出版者

ISBN

2018 年度実施状況報告書

栗田多喜夫広島大学, 工学研究科, 教授 (10356941)