研究課題/領域番号 |
16K00503
|
研究機関 | 電気通信大学 |
研究代表者 |
保木 邦仁 電気通信大学, 大学院情報理工学研究科, 准教授 (00436081)
|
研究分担者 |
西野 順二 電気通信大学, 大学院情報理工学研究科, 助教 (00281030)
伊藤 毅志 電気通信大学, 大学院情報理工学研究科, 准教授 (40262373)
村松 正和 電気通信大学, 大学院情報理工学研究科, 教授 (70266071)
|
研究期間 (年度) |
2016-04-01 – 2020-03-31
|
キーワード | ゲーム人工知能 / 機械学習 / ヒューリスティック探索 |
研究実績の概要 |
研究内容:チェス、将棋、二人ポーカーなどの思考能力を競う幾つかのゲームにおいて、現在の人工知能は人間よりも強くなりつつある。また、デジタルゲームにおいても、アクション及びシューティングゲームのノンプレイヤブルキャラクタ(NPC)は、ほぼ正確な行動をとることが可能である。その一方で、行動の選択肢が多く、ゲーム状態や状態間の遷移を部分的にしか観測できない、現実世界における競争により近いゲームにおいて、人工知能を強くする技術はチェスやアクションゲームに見られるほどには発達していない。本研究では、既存ヒューリスティック手法の大規模化を達成することにより、このようなゲームにおいて競争に勝つ人工知能技術の開発を目指した。 実績概要:平成29年度 (前年度) は、囲碁、麻雀、大貧民、チェスを題材に選び、本研究計画を実行した。平成30年度は、前年度の研究内容を発展させるため、より多様なルールのゲームにおいて研究を行うために、デジタルカーリングを新たな題材として選び同計画を実行した。この研究成果は和論文誌(松井亮平, 保木邦仁, 強化学習法によるデジタルカーリングの初歩的な行動知識の獲得, 情報処理学会論文誌, 59(11), pp. 2063-2073, 2018)にて報告された。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
概ね順調に進展してはいるが、一部の研究内容に平成30年度までの総括・発表が間に合わなかったものがあった。これを完了させるため、本研究は平成31年度に継続された。
|
今後の研究の推進方策 |
平成30年度までに間に合わなかった研究成果の総括を完了させる。
|
次年度使用額が生じた理由 |
論文投稿のための研究成果の総括に当初の予定よりも時間を費やしたため、期間延長承認申請を行った。追加実験に必要な設備備品として GPU を搭載したデスクトップ PC の購入を予定していたが、この予定を変更する可能性があり、発注の決定を次年度に行う。
|