研究課題/領域番号 |
16K00338
|
研究機関 | 慶應義塾大学 |
研究代表者 |
萩原 将文 慶應義塾大学, 理工学部(矢上), 教授 (80198655)
|
研究期間 (年度) |
2016-04-01 – 2019-03-31
|
キーワード | 畳込みニューラルネットワーク / 連想メモリ / 分散表現 |
研究実績の概要 |
平成28年度における課題は「視覚情報と言語情報の統合的処理機構の開発」であり、以下の項目が具体的な課題である。まず第一にCNN (Convolutional Neural Network:畳込みニューラルネットワーク) をベースとした視覚情報処理ニューラルネットワークの構築である。人とのコミュニケーションを考えると、ユーザの表情や感情の推定は重要である。そこで本年度は、Double-Column Convolutional Neural Network (DCNN) とSpatial Pyramid Pooling (SPP)を融合させた新しい表情認識システムの構築を行った。 第二の課題は、知識を扱うことのできるニューラルネットワークの構築である。知識表現の代表例として意味ネットワークがある。これは事象の連想関係を、ローカル表現を用いたネットワークにより表現する方法であり、概念の類似性を扱うことができない。そこで、単語の分散表現とRestricted Boltzmann Machine(RBM) を用いて新しい意味ネットワークの構築を行った。具体的には、以下の2つの研究を行った。まず連想メモリとしての改良である。既存のRBM 連想メモリでは自己連想記憶にしか対応していない。そこでネットワークに新たにミドル層を追加することで、双方向の相互連想、及び1 対多の想起が可能な連想メモリとした。二つ目は、分散表現された単語を扱えるようにする研究である。提案ネットワークでは単語の分散表現を用いて単語同士の関係性の学習を行う。これにより単語をベクトル情報で保持するため、従来の知識表現では対応できなかった未知語への対応が可能になった。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
CNN (Convolutional Neural Network) をベースとした視覚情報処理ニューラルネットワークの構築に関しては、特性的には必ずしも十分な結果は得られていないが、初年度であり、今後さらに改良を加えて行く予定である。第二の知識を扱うことのできるニューラルネットワークの構築に関しては、予想を超えた成果を得ることができた。具体的には、単語の分散表現とRestricted Boltzmann Machine(RBM)をもとにした新しい連想メモリを構築することができた。さらに、相互連想記憶能力と雑音耐性能力、記憶容量、及び1対多の想起能力に関しての特性評価実験により、満足の行くデータが得られている。
|
今後の研究の推進方策 |
平成29年度においては、統合的処理による入力画像からの物体に関する常識の自動獲得をめざす。入力画像は、学習済みの視覚情報処理ニューラルネットワークに入力され、物体の検出が行われる。検出された複数物体について、カラー画像から形状情報と色彩情報を、距離画像からは各物体の大きさの情報と物体間の相対的な位置関係を推定する。こうして、各物体のおおまかな大きさや位置を自動学習することができる。一方、視覚情報処理と並列に知識層を付加する。知識層に格納されている各物体に関する知識を連想処理することにより、画像情報、言語情報、加えて空間的な情報を用いて、物体に関する総合的で常識的な知識の自動獲得を可能とする。
|
次年度使用額が生じた理由 |
旅費に関しては、今年度は研究そのものに重点を置いた傾向があり、科研費による出張は行わなかった。 物品費に関しては、現状の研究ではハイエンドの計算機の購入は不要であり、したがって不経済となってしまう。今年度は、必要な計算パワーに応じた計算機を購入したため、資金に余裕ができた。
|
次年度使用額の使用計画 |
次年度は、旅費については計画書レベルでの出張を考えている。また物品費については余裕ができたので、高い計算パワーを必要とする研究が可能となりチャレンジしたいと考えている。
|