• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

柔構造決定過程モデルに関する学習アルゴリズムの研究

研究課題

研究課題/領域番号 18540111
研究種目

基盤研究(C)

配分区分補助金
応募区分一般
研究分野 数学一般(含確率論・統計数学)
研究機関千葉大学

研究代表者

蔵野 正美 (藏野 正美)  千葉大学, 教育学部, 教授 (70029487)

研究分担者 安田 正實 (安田 正実)  千葉大学, 理学部, 教授 (00041244)
中神 潤一  千葉大学, 理学部, 教授 (30092076)
門田 良信  和歌山大学, 教育学部, 教授 (90116294)
吉田 祐治 (吉田 裕治)  北九州市立大学, 経済学部, 教授 (90192426)
岩村 覚三  城西大学, 理学部, 講師 (00077918)
研究期間 (年度) 2006 – 2007
研究課題ステータス 完了 (2007年度)
配分額 *注記
2,930千円 (直接経費: 2,600千円、間接経費: 330千円)
2007年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2006年度: 1,500千円 (直接経費: 1,500千円)
キーワード柔構造決定モデル / マルコフ決定過程 / 学習アルゴリズム / ファジイモデル / 強化学習 / 最適適応政策 / 可信性過程 / 遺伝的アルゴリズム / マルコフ決定モデル / ニューロ動的計画法 / 最適方程式
研究概要

本研究は柔構造決定過程モデルに関する適応型及び強化学習型のアルゴリズムの理論及び実用的な応用を目的として研究を進め、主な研究成果は次の通りである。
1.柔構造モデルの構成及び解析法の発展研究
(a) ファジイ数学のpossibility及びcredibilityの基礎研究を進めて、可信性拡張定理を用いて、条件付き可信性測度群からCredibilistic process(可信性過程)を構成することに成功した。
これによりfuzzy環境のもとでの決定過程について、公理論的な裏付けのもとで理論展開の可能性が生まれたことになる。
(b) 吸収壁をもつ零和セミマルコフゲームに対して一般効用最適方程式を導出して、最適戦略の存在と特徴付けに成功した。
(c) ベイズ推定による品質管理において、未知パラメータの事前情報を測度を要素とする凸集合(区間)で表したより柔軟な品質管理法を提案し、従来のものと比較検討してその有効性を検証した。
2.適応型マルコフ決定過程の学習アルゴリズムの研究
推移確率行列が未知の多重連鎖Markov decision processに対して、得られたデータから推移行列の構造パターンを学習し、時間的差分型の学習アルゴリズム(TD-学習)を取り入れる"pattern matrix学習法"を開発した。これにより多重マルコフ連鎖の場合は基本的に解決される。
3.強化学習型の応用研究
(a) モデルの近似解を得るための強化学習アルゴリズムについては、ニューロ動的計画法の種々のモデルに適用可能なTD-型及びActor-Critic型のアルゴリズムの収束性を検討して、簡単なモデルでの数値実験によりその有効性を比較検討した。
(b) ファジイ環境の下での最短経路問題などのORモデルに対して、種々のfuzzy評価基準の下での最適解を求める手法(主に線形計画法)及び、遺伝的アルゴリズム、ファジイシミュレーションなどを組み合わせた新しいアルゴリズム(hybrid intelligent)を開発し、数値例により有効性を検証した

報告書

(3件)
  • 2007 実績報告書   研究成果報告書概要
  • 2006 実績報告書
  • 研究成果

    (16件)

すべて 2008 2007 2006 その他

すべて 雑誌論文 (13件) (うち査読あり 6件) 学会発表 (3件)

  • [雑誌論文] Fuzzy facility Iocation-allocation problem under the Hurwiczcriterion2008

    • 著者名/発表者名
      岩村 覚三 (共著)
    • 雑誌名

      European J.of Operational Research(To appear) 184

      ページ: 627-635

    • 関連する報告書
      2007 実績報告書
    • 査読あり
  • [雑誌論文] Fuzzy optimality relation for perception MDPs the average case2007

    • 著者名/発表者名
      蔵野正美(共著)
    • 雑誌名

      Fuzzy Sets and Systems 158

      ページ: 1905-1912

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2007 研究成果報告書概要
    • 査読あり
  • [雑誌論文] A structured pattern matrix algorithm for multichain Markov decision processes2007

    • 著者名/発表者名
      伊喜哲一郎(共著)
    • 雑誌名

      Mathematical Methods of Operations Research 66

      ページ: 545-555

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2007 研究成果報告書概要
    • 査読あり
  • [雑誌論文] Fuzzy optimality relation for perceptive MDPs - the average case2007

    • 著者名/発表者名
      Kurano, M., Yasuda, M., Nakagami, J., and Yoshida, Y.
    • 雑誌名

      Fuzzy Sets and Systems Vol. 158

      ページ: 1905-1912

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2007 研究成果報告書概要
  • [雑誌論文] A structured pattern matrix Algorithm for multichain Markov decision processes2007

    • 著者名/発表者名
      Iki, T., Horiguchi, M., and Kurano, M.
    • 雑誌名

      Mathematical Methods of Operations Research Vol. 66

      ページ: 545-555

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2007 研究成果報告書概要
  • [雑誌論文] Fuzzy optimality relation for perceptive MDPs-the average case2007

    • 著者名/発表者名
      蔵野 正美 (共著)
    • 雑誌名

      Fuzzy Sets and Systems 153

      ページ: 1905-1912

    • 関連する報告書
      2007 実績報告書
    • 査読あり
  • [雑誌論文] New models for shortest path problem with fuzzy arc lengths2007

    • 著者名/発表者名
      岩村 覚三 (共著)
    • 雑誌名

      Applied Mathematical Modelling 31

      ページ: 259-269

    • 関連する報告書
      2007 実績報告書
    • 査読あり
  • [雑誌論文] A fuzzy perceptive value for multi-variate stopping problem with a monotone rule2007

    • 著者名/発表者名
      蔵野正美(共著)
    • 雑誌名

      Bulletin of Informatics and Cybernetics (印刷中)

    • NAID

      120001944228

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] A structured pattern matrix algorithm for multichain Markov decision processes2007

    • 著者名/発表者名
      伊喜哲一郎(共著)
    • 雑誌名

      Mathematical Methods of Operations Research (印刷中)

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] A fuzzy approach to Markov decision processes with uncertain transition probabilities2006

    • 著者名/発表者名
      蔵野正美(共著)
    • 雑誌名

      Fuzzy Sets and Systems 157

      ページ: 2674-2682

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2007 研究成果報告書概要 2006 実績報告書
    • 査読あり
  • [雑誌論文] A fuzzy approach to Markov decision processes with uncertain transition probabilities2006

    • 著者名/発表者名
      Kurano, M., Yasuda, M., Nakagami, J., and Yoshida, Y.
    • 雑誌名

      Fuzzy Sets and Systems Vol. 157

      ページ: 2674-2682

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2007 研究成果報告書概要
  • [雑誌論文] A new evaluation of mean value for fuzzy numbers and its application to American put option under uncertainty2006

    • 著者名/発表者名
      吉田祐治(共著)
    • 雑誌名

      Fuzzy Sets and Systems 157

      ページ: 2614-2626

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] A Learning algorithm for communicating Markov decision processes with unknown transition matrices

    • 著者名/発表者名
      伊喜哲一郎(共著)
    • 雑誌名

      Bulletin of Informatics and Cybernetics (印刷中)

    • 関連する報告書
      2006 実績報告書
  • [学会発表] Adaptive Markov decision processes based on temporal difference method2007

    • 著者名/発表者名
      伊喜哲一郎(共著)
    • 学会等名
      日本数学学会
    • 発表場所
      東北大学
    • 年月日
      2007-09-24
    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2007 研究成果報告書概要
  • [学会発表] Adaptive Markov decision Processes based on temporal difference method2007

    • 著者名/発表者名
      Iki, T., Horiguchi, M., Yasuda, M., and Kurano, M.
    • 学会等名
      Mathematical Society of Japan, Autumn Meeting
    • 発表場所
      Tohoku Univ
    • 年月日
      2007-09-24
    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2007 研究成果報告書概要
  • [学会発表] Adaptive Markov decision processes based on difference method2007

    • 著者名/発表者名
      伊喜哲 一郎(共同)
    • 学会等名
      日本数学会
    • 発表場所
      東北大学
    • 年月日
      2007-09-24
    • 関連する報告書
      2007 実績報告書

URL: 

公開日: 2006-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi