The Development of educational system using imitation learning agent which imitates learner's behavior
Project/Area Number |
19K12260
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 62030:Learning support system-related
|
Research Institution | Osaka Electro-Communication University |
Principal Investigator |
植野 雅之 大阪電気通信大学, 総合情報学部, 准教授 (50300348)
|
Co-Investigator(Kenkyū-buntansha) |
高見 友幸 大阪電気通信大学, 総合情報学部, 教授 (50300314)
和田 慎二郎 プール学院短期大学, 秘書科, 教授 (70321114)
|
Project Period (FY) |
2019-04-01 – 2024-03-31
|
Project Status |
Granted (Fiscal Year 2022)
|
Budget Amount *help |
¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000)
Fiscal Year 2023: ¥390,000 (Direct Cost: ¥300,000、Indirect Cost: ¥90,000)
Fiscal Year 2022: ¥390,000 (Direct Cost: ¥300,000、Indirect Cost: ¥90,000)
Fiscal Year 2021: ¥390,000 (Direct Cost: ¥300,000、Indirect Cost: ¥90,000)
Fiscal Year 2020: ¥390,000 (Direct Cost: ¥300,000、Indirect Cost: ¥90,000)
Fiscal Year 2019: ¥2,600,000 (Direct Cost: ¥2,000,000、Indirect Cost: ¥600,000)
|
Keywords | 模倣学習エージェント / 説明可能なAI / 機械学習 / 模倣学習 / 教育エージェント / 敵対的生成ネットワーク / 論理的ボードゲーム / スキル学習 |
Outline of Research at the Start |
本研究の目的は,人間が機械知が協調して発展する未来の共生関係を実現するという見地に立ち,その関係に資する有効な教育エージェントとは何かを模索することである.本研究では機械学習により学習者の癖やスキルを含めた振る舞いを模倣する「模倣学習エージェント」を開発し,自分を振り返るための教育的な「鏡」として利用できるかを検証する.当面の学習対象としては,論理的ボードゲームにおける戦略的スキルを対象とする. 最終的には,複数の学習者に模倣学習エージェントを適用し,ネットワーク化することで競争的かつ協調的な教育環境を構築し,教育的検証をおこなうことで教育システムの新たな可能性を探る.
|
Outline of Annual Research Achievements |
昨年度までの研究では、機械学習を用いた模倣学習エージェントの構築に注力した。特に、論理的ボードゲームの戦術・戦略的スキルの学習に重点を置き、大量の棋譜データを用いてその生成に取り組んだ。しかし、模倣学習エージェントを自分自身や他人と対戦させ、または多数の模倣学習エージェント同士の仮想対戦を通じた学習方法は、必ずしも十分な教育効果を保証するものではなかった。そこで、「プレイ戦略分析システム」の開発を進め、学習者の戦略の理解と分析を支援しようとした。しかし、このシステムの構築には困難が伴い、完全な支援機能の実現は困難であるとの結論に達した。その中で、解決策として見い出したのが説明可能なAI(XAI)の導入であった。XAIは機械学習が学習した内容を人間が解釈可能にする技術で、ブラックボックス化されたモデルをホワイトボックス化し、理解可能にする。 このXAIを模倣学習エージェントに導入することで,「局所説明」によって、エージェントがある局面での行動を選択する際に、具体的に盤面のどの部分が影響を及ぼしているかを明確にすることが可能となった。これにより、学習者がエージェントの振る舞いやその背後にある戦略的思考を改めて確認することができる。 現在,我々は模倣学習エージェントの学習と利用を実用的なレベルに高めるため,アルゴリズムのパフォーマンス改善をおこなっている。また,戦略の可視化は実現できたが,その意味を読み取ることが難しい場合も多いため,言語化して説明する手法の開発もおこなっている。これにより,学習者はエージェントの行動や戦略をさらに深く理解し、異なるエージェントを比較するといったことが容易におこなえるようになることを期待している.これらの技術開発により,模倣学習エージェントを実用的に利用することが可能であることを実証していきたい.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
理由:計画では,第1段階は,模倣学習エージェントの開発と検証で,模倣学習エージェントを開発してその性能を検証することとしていた.第2段階は各種支援機能の開発で,この模倣学習エージェントを用いた様々な支援機能を開発することとしていた.第3段階は教育効果の確認としていた.現在,第2段階を実施しており,次は第3段階となる.最終年度を迎えてしまったため,第3段階である教育効果の確認は別の研究機会でおこなう他ないと考えている.一方で模倣学習エージェントが実用的に利用可能かをある程度実証する必要はあると考えており,第3段階に先鞭を付ける形にしたいと考えている.
|
Strategy for Future Research Activity |
模倣学習エージェントを棋譜から構築すること,模倣学習エージェントがある盤面に対して,そのような評価をおこなうかをXAIを用いてその盤面に対する評価を抽出するという機能については,ソフトウェアの実装・試行は完了している.一方でその学習のパフォーマンス等は必ずしも十分に実用的に利用可能なレベルに達しているとは言いがたい面があるため,利用するアルゴリズムの検討,実証など今後,おこなって,実用的なレベルのパフォーマンスが得られることを実証する研究を実施していく. また,XAIが出力する盤面評価はその学習者にとっては興味深い情報を示すことになるが,必ずしもその意味を読み取ることができるとは限らないという問題が出てくる.これについては,大規模言語モデル等を用いることにより言語化し,学習者にとって理解可能な情報に変換する機能を実装していきたい.また,可能であれば,模倣学習エージェントなどをリアルタイムで利用できるようにシステムとして実装し,より多人数での実証的な研究などにも手をつけていきたい.
|
Report
(4 results)
Research Products
(18 results)