研究課題/領域番号 |
16K00503
|
研究機関 | 電気通信大学 |
研究代表者 |
保木 邦仁 電気通信大学, 大学院情報理工学研究科, 准教授 (00436081)
|
研究分担者 |
西野 順二 電気通信大学, 大学院情報理工学研究科, 助教 (00281030)
伊藤 毅志 電気通信大学, 大学院情報理工学研究科, 助教 (40262373)
村松 正和 電気通信大学, 大学院情報理工学研究科, 教授 (70266071)
|
研究期間 (年度) |
2016-04-01 – 2019-03-31
|
キーワード | 囲碁 / 麻雀 / カーリング / 大貧民 |
研究実績の概要 |
チェス、将棋、二人ポーカーなどの思考能力を競う幾つかのゲームにおいて、現在の人工知能は人間よりも強くなりつつある。また、デジタルゲームにおいても、アクション及びシューティングゲームのノンプレイヤブルキャラクタ(NPC)は、ほぼ正確な行動をとることが可能である。その一方で、行動の選択肢が多く、ゲーム状態や状態間の遷移を部分的にしか観測できない、現実世界における競争により近いゲームにおいて、人工知能を強くする技術はチェスやアクションゲームに見られるほどには発達していない。本研究では、既存ヒューリスティック手法の大規模化を達成することにより、このようなゲームにおいて競争に勝つ人工知能技術の開発を目指す。平成28年度は、囲碁、麻雀、大貧民の人工知能技術を調査した。 囲碁はこの数年で人工知能が十分強くなったため、強くすることからプレイヤの棋力を推定することに目標を切り替えた。畳み込みニューラルネットワークの性能調査もかねて調査・研究を行い、共同研究者と論文を発表した(情報処理学会論文誌、57, 2365, 2016)。麻雀は現在の高性能AIの動向調査を行い、共同研究者と研究報告を行った(情報処理学会研究報告、2017-GI-37(14))。さらに、大貧民とカーリングを題材として既存強化学習法の調査を行った(情報処理学会研究報告、2017-GI-37(12))。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
平成28年度の計画は、囲碁、カーリング、パーティーゲームなどにおいて:(1)現在用いられている強化学習法や回帰法を調査し、既存の誤差関数やこれに準ずる関数の長所や問題点を調査、(2)熟達者がゲーム状態を認識する際の評価項目を調査、(3)最適化の数値的手法の調査(スケーリングの性質やロバスト性など)、(4)各ゲームプログラムの新規作成や既存プログラムの変更に取り組み、動作テストを行うことであった。 計画1番目の項目は、カードゲームの大貧民やカーリングを題材として行われた。三番目の項目は、畳み込みニューラルネットワークを用いた機械学習法を囲碁やカーリングに適用して行われた。四番目の項目は、麻雀の高性能AIを調査することにより行われた。二番目の項目は未着手であるが、概ね計画通りに研究が進行したと考えられる。
|
今後の研究の推進方策 |
各ゲームで、計算機実験を本格的に始動させて、大規模化の際に問題になる点を明らかにし、既存手法の改良に取り組む。また、得られたゲームプログラムの性能評価にも取り組む。将棋や二人ポーカーよりも計算科学的に困難なゲームにおいて、人知と同程度の強さを実現するために必要なパラメタ数は未知である。これを、本計画を遂行することにより明らかにする。性能評価は、既存プログラムとの対戦成績によりなされる。また、各ゲームの競技会を積極的に運営し、これに参加することにより得られる成績も参考にする。さらに、研究により得られた成果をまとめ、論文を投稿する。
|
次年度使用額が生じた理由 |
次年度使用額25,507円が生じた主な理由は,残額が足らずノートPCの購入を見送ったためである。
|
次年度使用額の使用計画 |
ノートPCを購入する。
|