研究概要 |
本年度は、一般的な確率分布のオンライン学習(学習用の例題が順次与えられる学習)を、場の理論的な観点から解明した。確率分布の学習は、ニューラル・ネットワークによる教師あり学習,教師なし学習を含む、最も一般的で重要な問題である。確率分布の学習に関して、バッチ学習(学習用例題が一度にすべて与えられる学習)の場合については、場の理論を用いた一般的な結果が既にBialek et.al.[Phys.Rev.Lett,,Vol.77(1996)4693.]によって得られていた。私は新たに「学習用の例題数が、観測の解像度を決定する。」という物理的な視点を導入し、問題の場の理論的な特質をより明確に把握した方向へ、彼らの定式化を拡張した。その結果、一般的な一次元確率分布のオンライン学習アルゴリズムを導き、その最適性の証明に成功した。また実際に、数値計算による実証にも成功した。 この結果は、「我々は学習のためにどのぐらいの自由度を用意すべきか?」という最も基本的かつ重要な問題へ、オンライン学習のコンテキストに於いて回答を与えるものである。複雑な対象の学習は、多くの自由度を必要とする一方、単純な対象の学習には、過多な自由度は効率を下げる要因となるからである。またこの結果は、「学習対象に応じて、ニューラル・ネットワークモデルの構造をどの様に変化させればよいか?」という問いへの基本的な回答に通じるものである。更に、最適なモデルとアルゴリズムの探索といった、従来的な結果とは大きく異なる。それは、最も一般的なモデルから出発し、例題数の物理的意味付けを通じて、操り込み群という統計力学の原理的な性質から、アルゴリズムが自然に導出される点である。
|