2015 Fiscal Year Research-status Report
異種情報を統合する階層型特徴表現モデルの学習とその応用に関する研究
Project/Area Number |
26330249
|
Research Institution | Shinshu University |
Principal Investigator |
丸山 稔 信州大学, 学術研究院工学系, 教授 (80283232)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | 深層学習 / 機械学習 / 画像認識 / 属性認識 / 構造学習 |
Outline of Annual Research Achievements |
本研究の目的は相互に関係を持つ文書、画像、音楽などの異種情報を統合する特徴表現モデルを確立することである。このための統合・特徴表現モデルとしてはまずDBM(Deep Boltzmann Machine)を用いることとし、異種情報を上位の隠れ層において統合する方式を検討している。 本年度の研究においては、画像を中心とした情報表現とその応用に関する研究を実施した。情報統合の事例として、画像以外の情報としては画像内容を表現するキーワード集合を考え、キーワードについては頻度分布(BOW=bag of words)表現を入力として用い、画像情報としては従来用いられているSIFT特徴などの画像特徴量と共に深層学習によってCNN(convolutional neural network)によって得られた特徴量を用いて学習・検証実験を実施した。画像・文書表現を統合するDBMの学習により、新規入力に関して得られた上位層表現を新たな画像カテゴリ識別のための特徴として用いたところ、元の画像表現より若干ではあるが識別能力の向上が見られた。 また、本年度の研究においては画像表現の基となるCNNの学習及びその応用に関する実験を行い、画像からの属性(画像記述キーワード)情報抽出実験、属性情報からの画像検索実験などを行い、ImageNet等を用いて得られた一般的なCNNを初期状態として属性毎に学習を実施することにより良好な能力が発揮できることを確認した。このような互いに関連性を持つタスクの学習を効率化するための研究にも着手し、CNNの場合、より入力に近い層の多くをコピーし、上位層についてのみ学習を行うことで効率的学習が可能になることを確認した。さらにCNNを画像中のターゲット領域抽出に適用し良好な結果を得た。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究の目的は相互に関係を持つ文書、画像、音楽などの異種情報を統合する特徴表現モデルを確立することである。本年度の研究では単語情報(キーワード)と画像を統合するDBMモデルを学習し、これにより得られる情報ベクトルが元の画像単体に関する特徴ベクトルに比べて画像識別に関して若干の向上をもたらすことを確認している。但し、精度向上はまだ小さなものに留まっており、さらなる向上を目指す必要がある。
|
Strategy for Future Research Activity |
これまでの研究により情報統合を実行することは可能となっている。今後は現在の基本構造の改良・見直しによりさらなる情報統合・表現能力の改善を図ると共に、画像認識等への応用を図る。 主たる適用分野は画像と文書(キーワード)とする。これまでの研究により画像情報表現の違いにより得られる特徴量に影響が及ぶことを確認しているが、これをテキスト情報についても確認する。このために現在のbow表現ではなくword2vec表現などを用いた場合の能力比較を行う。 現在、異種情報を統合する際にはDBMを用いているが、この時各種入力から統合へ至るまでの層の数が等しいなどの極めて対称性の高い構造を用いている。入力層に与えられる情報大きく異なっていることから、このような対称性は必ずしも必要とされるものではないと考えられる。現在学習時には事前に層の数を決定する必要があるが、適応的な構造の決定を含む最適化手法について今後検討を行う。 また、現在DBMを基本構造として用いているが、これは無向グラフであり、与えられた入力情報に対応する統合情報表現を計算するためには大きな計算量を要する。応用面を考えると計算量や表現に用いる記憶容量の低減などは重要な課題である。そこで、一旦DBM等を用いて得られたネットワーク構造をDBM以外の有向グラフを含む構造で近似的に表し、表現能力の維持と記憶容量と計算量の低減を両立するための方式を検討する。現在の画像入力表現はCNNなどの深層構造を用いて計算する必要があるため、これらを含めた全体の効率化の検討を図る。
|
Causes of Carryover |
PCワークステーションの購入時に、計画で見込んだより安価で取得することができたため。
|
Expenditure Plan for Carryover Budget |
現在多くのシミュレーション実験を並行して行っているが、実験のためにはGPGPUを用いた高速計算が望ましい。より多くのシミュレーションを実行できるようにするため、既存設備(PC)をGPU導入・更新により強化し実験環境を改善する予定である。このためのGPU購入・更新用資金に次年度使用額とH28年度請求額を併せて使用する。
|
Research Products
(2 results)