研究課題/領域番号 |
26330249
|
研究機関 | 信州大学 |
研究代表者 |
丸山 稔 信州大学, 学術研究院工学系, 教授 (80283232)
|
研究期間 (年度) |
2014-04-01 – 2017-03-31
|
キーワード | 深層学習 / 確率的トピックモデル / 画像認識 / 文書認識 / 多重音解析 / 画像想起性 |
研究実績の概要 |
本研究の目的は相互に関係を持つ文書、画像、音楽などの異種情報を統合する特徴表現モデルを確立することである。このための統合特徴表現モデルとしてはDBM(Deep Boltzmann Machine)を考え、異種特徴を上位の隠れ層で統合する方式を検討する。 本年度の研究においては、各種の情報についてRBM(Rrestricted Boltzmann Machine)やこれらを多層に重ねた深層構造のネットワークを適用して特徴抽出を行い、種々のタスクに効果的な表現を学習するための研究を実施した。データ種類としては、画像想起特性を表すデータ集合、ピアノ音源データ集合を用いた。これら各種のデータと共に、これらのデータ内容を表す単語集合を統合するために、文書データの特徴抽出・モデル化の実験も行った。文書データとしては複数の学会予稿集集合を用いた。各種のデータについて特徴量抽出方式としてDBN(Deep Belief Network)を適用した実験を行った。また文書集合については、Softmax RBM及び確率的トピックモデルの適用実験を行った。確率的トピックモデルとしてはLDA、pLSAを用いた。画像に関してはRGB情報を入力としたDBNによる特徴抽出学習を試み、音響データに関してはスペクトログラムに基づく情報を入力とする特徴量学習を試みた。双方ともに、白色化などの前処理を行い、音響データについては3乗根処理も施したものを入力として用いている。学習により得られた特徴量の特性を評価するために、画像に関しては想起性(memorability)スコアの高低識別実験、音響データ(ピアノ音源データ)については音が含まれているかどうかの識別実験を行った。双方共に、DBNは単純なSVMなどの他手法と比べ良好な識別能力を実現できることを確認した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
本研究の目的である異種情報統合のための基本構造であるDBNについて基本的な学習実験を種々の情報源について行っているものの、単語集合を介した統合方式についての実験が遅れているため。
|
今後の研究の推進方策 |
今後は、画像や音響信号でそれらの情報を記述する文書(単語集合)を持つデータを用い、各種情報を記述・特徴抽出するDBNを構築すると共に、学習により得られた構造を用いた推論方式(異種情報間での推論:キーワードからの画像・音楽の検索や、画像・音楽入力に対するキーワードの付与など)に関する実験を行う。さらに学習の効率化を図るために、既存の系に対して新規の情報を追加する際の学習方式の検討を行う。このとき、少数サンプルであっても良好な認識能力を実現できるように、既存の系に蓄積された知識を活用するtransfer learning (one-shot learning)技術の確立を図る。
|
次年度使用額が生じた理由 |
PCワークステーションの購入時に、当初調査した時点より安価で取得することができたため。
|
次年度使用額の使用計画 |
平成27年度には学習高速化のためにGPGPUを用いた方式の検討を行う予定であるが、それに用いるための購入資金に次年度使用額とH27年度請求額を併せて使用する。
|