分担者の提案した段階的正則化により思考・推論の順逆モデルの構築が可能であることを、簡単なデータを用いて実験的に確認する。まず認知心理学における概念形成で用いられるBrunerのデータを用いる。これは対象の個数、枠の数、形、色という4個の属性を持つ数個の図に対し、ある概念の正事例か負事例のいずれかが与えられている。ここでは連言的概念と選言的概念の2種類を用いた。なお正事例か負事例かという二つのクラスへの分類なので、強化学習と教師付き学習が実は等価である。いずれの概念例でも段階的正則化により、当初は粗い近似的規制を、次に正しい規則を発見することができた。 次にUCIの機械学習用データベースにあるレンズのデータを用いた。これは年齢、近視/遠視、乱視の有無、涙腺異常の有無の4属性データに基づき、ハードコンタクトレンズ、ソフトコンタクトレンズ、コンタクトレンズが不適という3クラスへの分類を行う24個のデータからなる。ただ単なる強化学習のみでは規則を見つけることは不可能なので、ここでも途中から正則化を導入する。この場合は問題が複雑なので、誤差のある程度小さくなるまで通常の強化学習を300回繰り返し計算を行い、その後90回の繰り返し計算で、3個の近似的規則が求まった。これで24データ中21個が説明可能である。次により小さな正則化パラメータを用いて150回の繰り返し計算により、正しい9個の規則が求まった。 複雑な課題では順逆モデルを各々求めるための繰り返し計算回数も多いが、それほど複雑な課題でなければ数十回程度の繰り返し計算で済む。これにより、思考・推論などの高次処理を順逆モデルの枠組みでモデル化することの可能性が示唆された。
|