2021 Fiscal Year Annual Research Report
最適制御理論に基づいた補助情報の観測・生成を伴う集団の最適探索戦略の理論構築
Project/Area Number |
21J20436
|
Allocation Type | Single-year Grants |
Research Institution | The University of Tokyo |
Principal Investigator |
鳥取 岳広 東京大学, 情報理工学系研究科, 特別研究員(DC1)
|
Project Period (FY) |
2021-04-28 – 2024-03-31
|
Keywords | 理論生物学 / 制御理論 / 最適制御 / 確率制御 / 部分観測確率制御 / 分散型確率制御 / 平均場制御 / control as inference |
Outline of Annual Research Achievements |
複数の個体からなる集団の情報処理や運動制御、コミュニケーションは分散型確率制御の観点から議論できる。しかしながら、分散型確率制御は複雑な問題であるため、既存の確率制御の解法では解けない問題があった。本研究では、control as inferenceという数学的技法を応用することで、分散型確率制御が機械学習の代表的解法であるEMアルゴリズムで解けることを示した。この結果は分散型確率制御を現実の問題に応用するうえで重要である。以上の結果は国内学会と査読ありの論文誌で発表した。 本研究で提案した分散型確率制御のEMアルゴリズムは、数値計算可能だが、解析計算が困難な問題があった。集団の普遍的法則を明らかにするうえで、分散型確率制御の解析的解法は重要である。本研究では、平均場制御の数学的技法を応用することで、分散型確率制御が既存の確率制御と似た解法で解けることを示した。加えて、LQG問題のような特殊な問題では、分散型確率制御が解析的に解けることを明らかにした。これらの結果は集団の普遍的法則を明らかにするうえで、重要になると考えられる。現在、学会での発表や論文への投稿の準備を進めている。 また平均場制御の数学的技法を使用することで、記憶に制限のある部分観測確率制御が既存の確率制御と似た解法で解けることも示した。一般に生物システムは機械と異なり記憶に強い制限があるため、この結果は部分観測確率制御を生物システムに応用するうえで重要になると考えられる。現在、学会での発表や論文への投稿の準備を進めている。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究課題である補助情報の観測・生成を伴う集団の最適探索戦略を明らかにするうえで、記憶に制限のある部分観測確率制御や分散型確率制御は重要な役割を担うと考えられる。しかしながら、これらは従来の確率制御の解法では解くことができない問題があった。本年度はcontrol as inferenceや平均場制御などの数学的技法を応用することで、記憶に制限のある部分観測確率制御や分散型確率制御を解くための一般理論を構築することができた。この一般理論は本研究課題である補助情報の観測・生成を伴う集団の最適探索戦略を明らかにするうえで重要な役割を担うと考えられる。したがって、本研究課題を達成するための一般理論を構築できたという点で、おおむね順調に進展していると評価した。
|
Strategy for Future Research Activity |
今後の研究の推進方策としては、(1)記憶に制限のある部分観測確率制御や分散型確率制御の生物システムへの具体的な応用と(2)平均場制御に基づく一般理論の更なる展開が挙げられる。 現在、記憶に制限のある部分観測確率制御や分散型確率制御を解くための一般理論を構築することができた。しかしながら、それらを解析的に解くことができる問題のクラスは限定されている。したがって、構築した一般理論を解析的に解けるような生物システムの問題設定を検討する必要があると考えられる。もし解析的に解くことが難しいならば、摂動論を応用することで、近似解に基づく議論が展開できないかを検討する。 また記憶に制限のある部分観測確率制御や分散型確率制御の一般理論を構築するうえで使用した平均場制御の数学的解法は汎用性が非常に高いため、より複雑なシステムに展開できると考えられる。特に現在は記憶に制限のある部分観測確率制御や分散型確率制御のマルコフジャンプシステムへの拡張を検討している。マルコフジャンプシステムは集団の環境適応を議論するうえでよく使用される数理モデルである。したがって、記憶に制限のある部分観測確率制御や分散型確率制御のマルコフジャンプシステムへの拡張は、本理論の重要性を示す良い例になると考えられる。
|