機械学習の情報幾何学的解析

Research Project

Project/Area Number	08780255
Research Category	Grant-in-Aid for Encouragement of Young Scientists (A)
Allocation Type	Single-year Grants
Research Field	計算機科学
Research Institution	Kanazawa University
Principal Investigator	池田和司金沢大学, 工学部, 助手 (10262552)
Project Period (FY)	1996
Project Status	Completed (Fiscal Year 1996)
Budget Amount *help	¥1,100,000 (Direct Cost: ¥1,100,000) Fiscal Year 1996: ¥1,100,000 (Direct Cost: ¥1,100,000)
Keywords	計算論的学習理論 / 予測誤差 / 積分幾何学 / 線形分離機械 / 漸近論 / EMアルゴリズム
Research Abstract	本研究は、機械学習において、与えられた例題の数と機械の性能の関係を、情報幾何学的手法により理論的に解決しようというものである。本研究では、学習の良さの評価に予測誤差を用いる。予測誤差とは、新規の問題がランダムに選ばれて与えられた時の機械の出力誤差の期待値である。その値は与えられた例題に依存するので、例題もランダムに選ばれるとしてその期待値をとる。それにより、予測誤差は与えられた例題数の関数になる。パラメータに対して出力が滑らかな関数である機械の予測誤差はパラメータ数m、例題数tの時にm/tとなることが知られているが、滑らかでない機械で最も単純な、線形分離機械では0.66m/tになることが実験的に知られている。そこで、線形分離機械の予測誤差を調べた。線形分離機械では与えられた例題が半球面上の点群になることを利用し、積分幾何学を用いて点群の凸包の面の数の期待値を求め、これとオイラの関係式から予測誤差の新しいバウンドを導いた。また、与えられたデータが不完全である場合についても考察した。不完全データから、欠損部分とパラメータの双方を反復的に推定する方法として、EMアルゴリズムがよく知られている。本研究では、例題数が大きく漸近論が適用可能である場合に、EMアルゴリズムで推定されたパラメータがどのような分布に従うかを調べた。その結果、真のパラメータを推定モデル空間に射影した点を中心とする正規分布をすることがわかった。原理的には、推定パラメータの分布から予測誤差が求められるのであるが、分布自体が複雑な式で表されるために予測誤差の導出には至らなかった。これが今後の課題である。

Report

(1 results)

1996 Annual Research Report

Research Products
(2 results)

All Publications (2 results)

[Publications] K.Ikeda,S.Amari: "Geometry of Admissible Parameter Region in Neural Learning" IEICE Trans Fundamentals. E79-A. 938-943 (1996)
- Related Report
  1996 Annual Research Report
[Publications] K.Ikeda,L.Xu: "The Probability Distribution of Parameters Learned with the EM Algontham" Proc.International Conf.on Neural Networks. 804-809 (1996)
- Related Report
  1996 Annual Research Report