計算論的学習理論や概念学習では、確率的かつ近似的に正しいとするPAC学習可能性と、目標概念の特徴と学習可能性の関係を示す規範としてVC(Vapnik-Chervonenkis)次元が提案されている。これは、PAC学習可能性における学習に必要となるサンプル数(Sample complexity)を評価しようというものである。一方、研究代表者はシステムの規模増大時に生じるトレードオフ関係の評価を情報縮約理論によりモデル化し、対象システムの性質を分類、評価する方法である柔軟性(elasticity)基準をすでに提案している。これを、従来行われてきた情報源符号化によるアプローチとは別の視点から、(1)機械学習におけるサンプル数とそのサンプルからの目標概念の推定の近似度のトレードオフ関係の評価に適用できるとこ、(2)VC次元を用いた概念クラスの分類と共通の視点に基づいていることについて、本年度の成果として大枠を示すことができた。また、PAC学習可能性は、目標概念に近い仮説集合を保持することを前提として、どの概念クラスが学習しやすいかを議論しており、その集合の中から目標概念を特定することまでを議論の対象とはしていない。一方、最終的に必要な学習のための計算量は、それらの仮説集合から目標概念を特定することの容易性をも加味したものとして定義されるべきであると考えられる。そこで、特に研究分担社の専門分野である符号の重み分布と誤り訂正能力との関係をもとに目標概念の構造をクラス分類し、(1)柔軟性を用いた評価をより厳密に行い、(2)VC次元との対応関係を明確にし、(3)学習可能性に関するより有効な基準を提案するための基礎的な検討を続けている。
|