研究課題/領域番号 |
20J13556
|
研究種目 |
特別研究員奨励費
|
配分区分 | 補助金 |
応募区分 | 国内 |
審査区分 |
小区分61040:ソフトコンピューティング関連
|
研究機関 | 東京大学 |
研究代表者 |
田村 浩人 東京大学, 工学系研究科, 特別研究員(DC2)
|
研究期間 (年度) |
2020-04-24 – 2022-03-31
|
研究課題ステータス |
完了 (2021年度)
|
配分額 *注記 |
2,100千円 (直接経費: 2,100千円)
2021年度: 1,000千円 (直接経費: 1,000千円)
2020年度: 1,100千円 (直接経費: 1,100千円)
|
キーワード | リカレントニューラルネットワーク / リザバー計算 / 逐次教師あり学習 / FORCE学習 / Full-FORCE学習 |
研究開始時の研究の概要 |
動物の脳内におけるミラーニューロンとは,自らある行動をとる時と,他個体によるその行動を知覚する時の両方で活動する神経細胞を指す.ミラーニューロンシステムは,動物が他個体の動作や鳴き声を模倣する際に重要な役割を担っていると考えられているが,その計算論的な仕組みを説明できる神経数理モデルは未だ存在しない. そこで本研究では,脳機能の様々な側面を「外部環境の変化の予測」という観点から説明する予測符号化理論に基づいて,ミラーニューロンシステムの働きを解明することを目指す.また提案モデルを拡張することで,工場用や介護用のロボットが人間からの模倣によって動作を習得するような学習方式の実現が期待される.
|
研究実績の概要 |
前年度に開発したTwo-step FORCE学習は,従来のFORCE学習に比べて計算量が小さいという利点の一方で,主学習で用いる入力や教師データを事前学習でも使わなければならないという欠点があった.本年度はこれを解決するため,事前学習において様々なタイプの時系列を網羅した入力や教師データを用いた,Transfer-FORCE学習を開発した.本手法は,一度事前学習を行えば主学習にて様々なタスクを扱えるため,従来のFORCE学習と同様に扱うことができる.本手法についての数値的・理論的解析をまとめた論文が学術誌に掲載された. 並行して,前年度に引き続き,FORCE学習の発展的手法であるFull-FORCE学習の改良に注力した.Full-FORCE学習では,隠れ層の活動の目標値を生成するために,学習対象のネットワークに加えて,第二のネットワーク(教師リザバー)を用いる.Full-FORCE学習における仮定では,これら2つのネットワークは共通のハイパーパラメータを持つ必要があるため,独立に最適なハイパーパラメータ探索を行えないという問題があった.これを解決するため,本研究では,(i)Partial-FORCE学習, (ii)Hidden-FORCE学習,という2つの発展的手法を開発した. Partial-FORCE学習では,各ネットワークの一部のニューロンのみを学習の対象とすることで,様々なモデル構造を実現可能にした.各モデル構造と学習性能の関係を解析した結果を国際会議にて発表した. Hidden-FORCE学習では,学習に用いる誤差の定義を修正することで,教師リザバーのパラメータに関する情報が不要となった.これにより,独立なハイパーパラメータ探索が可能になった他,実験データを隠れ層の活動の目標値として陽に与える場合にも適用可能となった.現在この内容は投稿論文として準備中である.
|
現在までの達成度 (段落) |
令和3年度が最終年度であるため、記入しない。
|
今後の研究の推進方策 |
令和3年度が最終年度であるため、記入しない。
|