研究課題/領域番号 |
18540111
|
研究種目 |
基盤研究(C)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
数学一般(含確率論・統計数学)
|
研究機関 | 千葉大学 |
研究代表者 |
蔵野 正美 (藏野 正美) 千葉大学, 教育学部, 教授 (70029487)
|
研究分担者 |
安田 正實 (安田 正実) 千葉大学, 理学部, 教授 (00041244)
中神 潤一 千葉大学, 理学部, 教授 (30092076)
門田 良信 和歌山大学, 教育学部, 教授 (90116294)
吉田 祐治 (吉田 裕治) 北九州市立大学, 経済学部, 教授 (90192426)
岩村 覚三 城西大学, 理学部, 講師 (00077918)
|
研究期間 (年度) |
2006 – 2007
|
研究課題ステータス |
完了 (2007年度)
|
配分額 *注記 |
2,930千円 (直接経費: 2,600千円、間接経費: 330千円)
2007年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2006年度: 1,500千円 (直接経費: 1,500千円)
|
キーワード | 柔構造決定モデル / マルコフ決定過程 / 学習アルゴリズム / ファジイモデル / 強化学習 / 最適適応政策 / 可信性過程 / 遺伝的アルゴリズム / マルコフ決定モデル / ニューロ動的計画法 / 最適方程式 |
研究概要 |
本研究は柔構造決定過程モデルに関する適応型及び強化学習型のアルゴリズムの理論及び実用的な応用を目的として研究を進め、主な研究成果は次の通りである。 1.柔構造モデルの構成及び解析法の発展研究 (a) ファジイ数学のpossibility及びcredibilityの基礎研究を進めて、可信性拡張定理を用いて、条件付き可信性測度群からCredibilistic process(可信性過程)を構成することに成功した。 これによりfuzzy環境のもとでの決定過程について、公理論的な裏付けのもとで理論展開の可能性が生まれたことになる。 (b) 吸収壁をもつ零和セミマルコフゲームに対して一般効用最適方程式を導出して、最適戦略の存在と特徴付けに成功した。 (c) ベイズ推定による品質管理において、未知パラメータの事前情報を測度を要素とする凸集合(区間)で表したより柔軟な品質管理法を提案し、従来のものと比較検討してその有効性を検証した。 2.適応型マルコフ決定過程の学習アルゴリズムの研究 推移確率行列が未知の多重連鎖Markov decision processに対して、得られたデータから推移行列の構造パターンを学習し、時間的差分型の学習アルゴリズム(TD-学習)を取り入れる"pattern matrix学習法"を開発した。これにより多重マルコフ連鎖の場合は基本的に解決される。 3.強化学習型の応用研究 (a) モデルの近似解を得るための強化学習アルゴリズムについては、ニューロ動的計画法の種々のモデルに適用可能なTD-型及びActor-Critic型のアルゴリズムの収束性を検討して、簡単なモデルでの数値実験によりその有効性を比較検討した。 (b) ファジイ環境の下での最短経路問題などのORモデルに対して、種々のfuzzy評価基準の下での最適解を求める手法(主に線形計画法)及び、遺伝的アルゴリズム、ファジイシミュレーションなどを組み合わせた新しいアルゴリズム(hybrid intelligent)を開発し、数値例により有効性を検証した
|