研究概要 |
まず,平成7年度に交付された科学研究費によりエンジニアリングワークステーションを購入し,研究環境を飛躍的に向上させることができた.その研究環境をもとに,いくつかの有用な知見をあらたに得ることができ,学会において研究発表も行うことができた.具体的にはつぎのような手順により研究を遂行した. 1.まず,マルコフ決定過程において最適な制御則(最適政策)が定義される2つの評価規範(割引総期待利得,平均総期待利得)をもとに,分散学習オートマタについて漸近的挙動を示す評価量をあらたに導入した. 2.それらの評価規範に基づいて,マルコフ決定過程の数値例について購入したエンジニアリング・ワークステーションによって計算機シニュレーションを行った.結果として,提案した分散学習オートマタの有効性をシミュレーション結果よりあらためて実験的に確認することができた. シミュレーション結果をもとに,第4回計測自動制御学会中国支部学術講演会にて学会発表を行った.発表の場では,関連の研究を行う研究者らによってまずまずの評価を受けることができ,お互いの情報交換を行うことができた. 3.理論的把握はまだ行っていないもののこれまで得た知見をもとに電子情報通信学会への投稿論文(ショートノート)を執筆中である.現在,このショートノートのまとめと並行して提案した分散学習オートマタの条件最適性を検討中である.ショートノートの投稿は本年度に間に合わなかったものの,結果として今回得た科学研究費によって関連学会へフルペ-パで論文発表を行うための十分な足掛かりを作ることができたと言える.
|