• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2022 Fiscal Year Research-status Report

The Development of educational system using imitation learning agent which imitates learner's behavior

Research Project

Project/Area Number 19K12260
Research InstitutionOsaka Electro-Communication University

Principal Investigator

植野 雅之  大阪電気通信大学, 総合情報学部, 准教授 (50300348)

Co-Investigator(Kenkyū-buntansha) 高見 友幸  大阪電気通信大学, 総合情報学部, 教授 (50300314)
Project Period (FY) 2019-04-01 – 2024-03-31
Keywords模倣学習エージェント / 説明可能なAI
Outline of Annual Research Achievements

昨年度までの研究では、機械学習を用いた模倣学習エージェントの構築に注力した。特に、論理的ボードゲームの戦術・戦略的スキルの学習に重点を置き、大量の棋譜データを用いてその生成に取り組んだ。しかし、模倣学習エージェントを自分自身や他人と対戦させ、または多数の模倣学習エージェント同士の仮想対戦を通じた学習方法は、必ずしも十分な教育効果を保証するものではなかった。そこで、「プレイ戦略分析システム」の開発を進め、学習者の戦略の理解と分析を支援しようとした。しかし、このシステムの構築には困難が伴い、完全な支援機能の実現は困難であるとの結論に達した。その中で、解決策として見い出したのが説明可能なAI(XAI)の導入であった。XAIは機械学習が学習した内容を人間が解釈可能にする技術で、ブラックボックス化されたモデルをホワイトボックス化し、理解可能にする。
このXAIを模倣学習エージェントに導入することで,「局所説明」によって、エージェントがある局面での行動を選択する際に、具体的に盤面のどの部分が影響を及ぼしているかを明確にすることが可能となった。これにより、学習者がエージェントの振る舞いやその背後にある戦略的思考を改めて確認することができる。
現在,我々は模倣学習エージェントの学習と利用を実用的なレベルに高めるため,アルゴリズムのパフォーマンス改善をおこなっている。また,戦略の可視化は実現できたが,その意味を読み取ることが難しい場合も多いため,言語化して説明する手法の開発もおこなっている。これにより,学習者はエージェントの行動や戦略をさらに深く理解し、異なるエージェントを比較するといったことが容易におこなえるようになることを期待している.これらの技術開発により,模倣学習エージェントを実用的に利用することが可能であることを実証していきたい.

Current Status of Research Progress
Current Status of Research Progress

3: Progress in research has been slightly delayed.

Reason

理由:計画では,第1段階は,模倣学習エージェントの開発と検証で,模倣学習エージェントを開発してその性能を検証することとしていた.第2段階は各種支援機能の開発で,この模倣学習エージェントを用いた様々な支援機能を開発することとしていた.第3段階は教育効果の確認としていた.現在,第2段階を実施しており,次は第3段階となる.最終年度を迎えてしまったため,第3段階である教育効果の確認は別の研究機会でおこなう他ないと考えている.一方で模倣学習エージェントが実用的に利用可能かをある程度実証する必要はあると考えており,第3段階に先鞭を付ける形にしたいと考えている.

Strategy for Future Research Activity

模倣学習エージェントを棋譜から構築すること,模倣学習エージェントがある盤面に対して,そのような評価をおこなうかをXAIを用いてその盤面に対する評価を抽出するという機能については,ソフトウェアの実装・試行は完了している.一方でその学習のパフォーマンス等は必ずしも十分に実用的に利用可能なレベルに達しているとは言いがたい面があるため,利用するアルゴリズムの検討,実証など今後,おこなって,実用的なレベルのパフォーマンスが得られることを実証する研究を実施していく.
また,XAIが出力する盤面評価はその学習者にとっては興味深い情報を示すことになるが,必ずしもその意味を読み取ることができるとは限らないという問題が出てくる.これについては,大規模言語モデル等を用いることにより言語化し,学習者にとって理解可能な情報に変換する機能を実装していきたい.また,可能であれば,模倣学習エージェントなどをリアルタイムで利用できるようにシステムとして実装し,より多人数での実証的な研究などにも手をつけていきたい.

Causes of Carryover

コロナ渦によって,オンラインでの学会発表などにより出張旅費等が思ったより消費されなかったため.また,棋譜収集などのために確保していた人件費分の作 業が研究室学生によるボランティアでまかなえたため.

  • Research Products

    (5 results)

All 2023 2022 Other

All Journal Article (1 results) Presentation (3 results) (of which Int'l Joint Research: 1 results) Remarks (1 results)

  • [Journal Article] Learning Support by Visualizing Game Strategies From Imitation Learning Agents2022

    • Author(s)
      Ueno,M., Takami T.
    • Journal Title

      Proc. of 2022 IEEE 11th Global Conference on Consumer Electronics (GCCE)

      Volume: 1 Pages: 588,589

    • DOI

      10.1109/GCCE56475.2022.10014419

  • [Presentation] 模倣学習エージェントからのゲーム戦略の可視化と支援機能2023

    • Author(s)
      植野,高見
    • Organizer
      ゲーム学会第21回全国大会
  • [Presentation] 模倣学習エージェントの性能評価について2022

    • Author(s)
      植野,高見
    • Organizer
      ゲーム学会第20回合同研究会
  • [Presentation] Learning Support by Visualizing Game Strategies From Imitation Learning Agents2022

    • Author(s)
      Masayuki UENO, Tomoyuki TAKAMI
    • Organizer
      2022 IEEE 11th Global Conference on Consumer Electronics (GCCE)
    • Int'l Joint Research
  • [Remarks] 「学習者の振る舞いを模倣する模倣学習エージェントを用いた教育システムの開発」

    • URL

      https://mulab.osakac.ac.jp/page_20191029025556

URL: 

Published: 2023-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi