柔構造決定過程モデルに関する学習アルゴリズムの研究

研究課題

研究課題/領域番号	18540111
研究種目	基盤研究(C)
配分区分	補助金
応募区分	一般
研究分野	数学一般(含確率論・統計数学)
研究機関	千葉大学
研究代表者	蔵野正美 (藏野正美) 千葉大学, 教育学部, 教授 (70029487)
研究分担者	安田正實 (安田正実) 千葉大学, 理学部, 教授 (00041244) 中神潤一千葉大学, 理学部, 教授 (30092076) 門田良信和歌山大学, 教育学部, 教授 (90116294) 吉田祐治 (吉田裕治) 北九州市立大学, 経済学部, 教授 (90192426) 岩村覚三城西大学, 理学部, 講師 (00077918)
研究期間 (年度)	2006 – 2007
研究課題ステータス	完了 (2007年度)
配分額 *注記	2,930千円 (直接経費: 2,600千円、間接経費: 330千円) 2007年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円) 2006年度: 1,500千円 (直接経費: 1,500千円)
キーワード	柔構造決定モデル / マルコフ決定過程 / 学習アルゴリズム / ファジイモデル / 強化学習 / 最適適応政策 / 可信性過程 / 遺伝的アルゴリズム / マルコフ決定モデル / ニューロ動的計画法 / 最適方程式
研究概要	本研究は柔構造決定過程モデルに関する適応型及び強化学習型のアルゴリズムの理論及び実用的な応用を目的として研究を進め、主な研究成果は次の通りである。 1.柔構造モデルの構成及び解析法の発展研究 (a) ファジイ数学のpossibility及びcredibilityの基礎研究を進めて、可信性拡張定理を用いて、条件付き可信性測度群からCredibilistic process(可信性過程)を構成することに成功した。これによりfuzzy環境のもとでの決定過程について、公理論的な裏付けのもとで理論展開の可能性が生まれたことになる。 (b) 吸収壁をもつ零和セミマルコフゲームに対して一般効用最適方程式を導出して、最適戦略の存在と特徴付けに成功した。 (c) ベイズ推定による品質管理において、未知パラメータの事前情報を測度を要素とする凸集合(区間)で表したより柔軟な品質管理法を提案し、従来のものと比較検討してその有効性を検証した。 2.適応型マルコフ決定過程の学習アルゴリズムの研究推移確率行列が未知の多重連鎖Markov decision processに対して、得られたデータから推移行列の構造パターンを学習し、時間的差分型の学習アルゴリズム(TD-学習)を取り入れる"pattern matrix学習法"を開発した。これにより多重マルコフ連鎖の場合は基本的に解決される。 3.強化学習型の応用研究 (a) モデルの近似解を得るための強化学習アルゴリズムについては、ニューロ動的計画法の種々のモデルに適用可能なTD-型及びActor-Critic型のアルゴリズムの収束性を検討して、簡単なモデルでの数値実験によりその有効性を比較検討した。 (b) ファジイ環境の下での最短経路問題などのORモデルに対して、種々のfuzzy評価基準の下での最適解を求める手法(主に線形計画法)及び、遺伝的アルゴリズム、ファジイシミュレーションなどを組み合わせた新しいアルゴリズム(hybrid intelligent)を開発し、数値例により有効性を検証した

報告書

(3件)

2007 実績報告書研究成果報告書概要
2006 実績報告書

研究成果
(16件)

すべて 2008 2007 2006 その他

すべて雑誌論文 (13件) (うち査読あり 6件) 学会発表 (3件)

[雑誌論文] Fuzzy facility Iocation-allocation problem under the Hurwiczcriterion2008
- 著者名/発表者名
  岩村覚三 (共著)
- 雑誌名
  
  European J.of Operational Research(To appear) 184
  
  ページ: 627-635
- 関連する報告書
  2007 実績報告書
- 査読あり
[雑誌論文] Fuzzy optimality relation for perception MDPs the average case2007
- 著者名/発表者名
  蔵野正美(共著)
- 雑誌名
  
  Fuzzy Sets and Systems 158
  
  ページ: 1905-1912
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2007 研究成果報告書概要
- 査読あり
[雑誌論文] A structured pattern matrix algorithm for multichain Markov decision processes2007
- 著者名/発表者名
  伊喜哲一郎(共著)
- 雑誌名
  
  Mathematical Methods of Operations Research 66
  
  ページ: 545-555
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2007 研究成果報告書概要
- 査読あり
[雑誌論文] Fuzzy optimality relation for perceptive MDPs - the average case2007
- 著者名/発表者名
  Kurano, M., Yasuda, M., Nakagami, J., and Yoshida, Y.
- 雑誌名
  
  Fuzzy Sets and Systems Vol. 158
  
  ページ: 1905-1912
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2007 研究成果報告書概要
[雑誌論文] A structured pattern matrix Algorithm for multichain Markov decision processes2007
- 著者名/発表者名
  Iki, T., Horiguchi, M., and Kurano, M.
- 雑誌名
  
  Mathematical Methods of Operations Research Vol. 66
  
  ページ: 545-555
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2007 研究成果報告書概要
[雑誌論文] Fuzzy optimality relation for perceptive MDPs-the average case2007
- 著者名/発表者名
  蔵野正美 (共著)
- 雑誌名
  
  Fuzzy Sets and Systems 153
  
  ページ: 1905-1912
- 関連する報告書
  2007 実績報告書
- 査読あり
[雑誌論文] New models for shortest path problem with fuzzy arc lengths2007
- 著者名/発表者名
  岩村覚三 (共著)
- 雑誌名
  
  Applied Mathematical Modelling 31
  
  ページ: 259-269
- 関連する報告書
  2007 実績報告書
- 査読あり
[雑誌論文] A fuzzy perceptive value for multi-variate stopping problem with a monotone rule2007
- 著者名/発表者名
  蔵野正美(共著)
- 雑誌名
  
  Bulletin of Informatics and Cybernetics (印刷中)
- NAID
  120001944228
- 関連する報告書
  2006 実績報告書
[雑誌論文] A structured pattern matrix algorithm for multichain Markov decision processes2007
- 著者名/発表者名
  伊喜哲一郎(共著)
- 雑誌名
  
  Mathematical Methods of Operations Research (印刷中)
- 関連する報告書
  2006 実績報告書
[雑誌論文] A fuzzy approach to Markov decision processes with uncertain transition probabilities2006
- 著者名/発表者名
  蔵野正美(共著)
- 雑誌名
  
  Fuzzy Sets and Systems 157
  
  ページ: 2674-2682
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2007 研究成果報告書概要 2006 実績報告書
- 査読あり
[雑誌論文] A fuzzy approach to Markov decision processes with uncertain transition probabilities2006
- 著者名/発表者名
  Kurano, M., Yasuda, M., Nakagami, J., and Yoshida, Y.
- 雑誌名
  
  Fuzzy Sets and Systems Vol. 157
  
  ページ: 2674-2682
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2007 研究成果報告書概要
[雑誌論文] A new evaluation of mean value for fuzzy numbers and its application to American put option under uncertainty2006
- 著者名/発表者名
  吉田祐治(共著)
- 雑誌名
  
  Fuzzy Sets and Systems 157
  
  ページ: 2614-2626
- 関連する報告書
  2006 実績報告書
[雑誌論文] A Learning algorithm for communicating Markov decision processes with unknown transition matrices
- 著者名/発表者名
  伊喜哲一郎(共著)
- 雑誌名
  
  Bulletin of Informatics and Cybernetics (印刷中)
- 関連する報告書
  2006 実績報告書
[学会発表] Adaptive Markov decision processes based on temporal difference method2007
- 著者名/発表者名
  伊喜哲一郎(共著)
- 学会等名
  日本数学学会
- 発表場所
  東北大学
- 年月日
  2007-09-24
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2007 研究成果報告書概要
[学会発表] Adaptive Markov decision Processes based on temporal difference method2007
- 著者名/発表者名
  Iki, T., Horiguchi, M., Yasuda, M., and Kurano, M.
- 学会等名
  Mathematical Society of Japan, Autumn Meeting
- 発表場所
  Tohoku Univ
- 年月日
  2007-09-24
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2007 研究成果報告書概要
[学会発表] Adaptive Markov decision processes based on difference method2007
- 著者名/発表者名
  伊喜哲一郎(共同)
- 学会等名
  日本数学会
- 発表場所
  東北大学
- 年月日
  2007-09-24
- 関連する報告書
  2007 実績報告書

柔構造決定過程モデルに関する学習アルゴリズムの研究

研究代表者

蔵野 正美 (藏野 正美) 千葉大学, 教育学部, 教授 (70029487)

2,930千円 (直接経費: 2,600千円、間接経費: 330千円)

報告書

研究成果

[雑誌論文] Fuzzy facility Iocation-allocation problem under the Hurwiczcriterion2008

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Fuzzy optimality relation for perception MDPs the average case2007

著者名/発表者名

雑誌名

説明

関連する報告書

[雑誌論文] A structured pattern matrix algorithm for multichain Markov decision processes2007

著者名/発表者名

雑誌名

説明

関連する報告書

[雑誌論文] Fuzzy optimality relation for perceptive MDPs - the average case2007

著者名/発表者名

雑誌名

説明

関連する報告書

[雑誌論文] A structured pattern matrix Algorithm for multichain Markov decision processes2007

著者名/発表者名

雑誌名

説明

関連する報告書

[雑誌論文] Fuzzy optimality relation for perceptive MDPs-the average case2007

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] New models for shortest path problem with fuzzy arc lengths2007

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] A fuzzy perceptive value for multi-variate stopping problem with a monotone rule2007

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] A structured pattern matrix algorithm for multichain Markov decision processes2007

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] A fuzzy approach to Markov decision processes with uncertain transition probabilities2006

著者名/発表者名

雑誌名

説明

関連する報告書

[雑誌論文] A fuzzy approach to Markov decision processes with uncertain transition probabilities2006

著者名/発表者名

雑誌名

説明

関連する報告書

[雑誌論文] A new evaluation of mean value for fuzzy numbers and its application to American put option under uncertainty2006

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] A Learning algorithm for communicating Markov decision processes with unknown transition matrices

著者名/発表者名

雑誌名

関連する報告書

[学会発表] Adaptive Markov decision processes based on temporal difference method2007

著者名/発表者名

学会等名

発表場所

年月日

説明

関連する報告書

[学会発表] Adaptive Markov decision Processes based on temporal difference method2007

著者名/発表者名

学会等名

発表場所

年月日

説明

関連する報告書

[学会発表] Adaptive Markov decision processes based on difference method2007

蔵野正美 (藏野正美) 千葉大学, 教育学部, 教授 (70029487)