意思決定問題は、情報通信技術の広範かつ重要な応用の根底にあり、機械学習・人工知能の基礎問題として熱心に研究されている。しかし、動的に変化する不確実な環境での意思決定とは、ベターな選択肢の探索と速やかな決断という難しいトレードオフを孕んだ「多本腕バンディット問題(Multi-armed bandit problem(MAB))」であり、その解決は容易ではない。本研究の目的は、単一光子の物理的性質を積極利用することにより、人工知能の時代における光及び光技術による新たな価値として、単一光子を用いた意思決定機能の可能性を示すことである。 本年度は、単一光子を用いた意思決定システムにおいて、「意思決定」と「報酬」の間に、光過程がどのように関与しているかを明確化するために、圏論(Category theory)を用いた分析に世界に先駆けて取り組んだ。その結果、「意思決定」と「報酬」の「直積」(Product)及び「直和」(Coproduct)、さらにこれらの核と余核に相当する「マシンの環境」及び「光の環境」を考慮することで、全体システムが三角圏を成すという知見が得られた。このことは、意思決定において6個の対象(Object)が8面体の図式のなかで動作することを意味しており、意思決定における環境系の役割が明確に位置づけられる。三角圏において知られている組ひも構造を基礎として単一光子意思決定システムを分析し、時間経過とともに組ひもが解かれる様子を定量評価することに成功した。
|