2017 Fiscal Year Research-status Report
集合知の情報集約過程の定量的記述と社会的学習の影響
Project/Area Number |
17K00347
|
Research Institution | Hirosaki University |
Principal Investigator |
守 真太郎 弘前大学, 理工学研究科, 教授 (70296424)
|
Co-Investigator(Kenkyū-buntansha) |
中山 一昭 信州大学, 学術研究院理学系, 准教授 (20281040)
高橋 泰城 北海道大学, 文学研究科, 准教授 (60374170)
|
Project Period (FY) |
2017-04-01 – 2021-03-31
|
Keywords | ゲーム理論 / 社会的学習 / 投票者モデル / ナッシュ戦略 / 選挙データ |
Outline of Annual Research Achievements |
(1)非定常多腕バンディットゲームの社会的学習エージェント系の混合戦略(学習における社会的学習の比率r)におけるナッシュ戦略、パレート戦略を厳密に求め、特にナッシュ戦略が進化論的な安定なロバストな戦略であることを示した。独自学習の成功確率、社会的学習の成功確率、環境の変化の確率、エージェント数の空間で、ナッシュ戦略、パレート戦略が独自学習のみの戦略より期待リターンが高くなる領域を厳密に求めた。 (2)(1)の理論的な結果を検証する集団実験を実施した。ナッシュ戦略を検証する実験では、被験者は概ねナッシュ戦略に対応するパラメータ近傍のパラメータを採用した。パレート戦略の検証実験でもパラメータに関してはパレート戦略の近傍のパラメータを採用した。しかし、ナッシュ戦略を検証する実験では平均リターンはナッシュ戦略の期待リターンより有意に高く、そのメカニズムは不明である。実験データからは被験者の戦略に目立った特徴は確認できていない。 (3)選挙データのモデル化に関しては、平均場投票者モデルをネットワーク化したモデルを導入し、解析を行った。このモデルは選挙区間の得票率のゆらぎの強い相関を記述するモデルであり、また、モデルをランダムマルコフ場で近似して解析的なアプローチをすすめた。 (4)非定常多腕バンディットゲームの社会的学習エージェント系の戦略パラメータrを更新するモデルの解析を行った。期待リターンの差、期待リターンの微分などでダイナミクスが与えられたとき、戦略パラメータrがナッシュに、全エージェントの期待リターンの微分でダイナミクスが与えられたときパレート戦略に収束することを示した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
非定常多腕バンディットの理論的な研究の進捗状況、集団実験で検証も行えたことは想定通りであり、研究は順調に進んでいる。ただ、実験結果に関しては、理論の予想より被験者のパフォーマンスがよく、その理由がデータからは理解できないという問題に直面している。理論モデルのエージェントの戦略空間が狭いためなのかどうか明らかにすべく、モデルを拡張して解析を進めているが、それでも実験結果を説明できていない。選挙のモデルに関してはネットワーク上の平均場投票者モデルの数理構造が興味深いことがわかり、成果に期待している。
|
Strategy for Future Research Activity |
非定常多腕バンディットゲームについてはダイナミクスの問題、選挙のモデル化についてはネットワーク上の平均場投票者モデルの解析とデータ同化をクリアして論文にまとめる。その後、前者に関しては戦略空間を広げたうえで最適解の解析を行う。
|
Causes of Carryover |
年度末の旅費で差額が生じたため。次年度の打ち合わせの旅費に差額分を加えて執行する。
|
Research Products
(11 results)