研究課題/領域番号 |
17K00108
|
研究機関 | 高知工科大学 |
研究代表者 |
松崎 公紀 高知工科大学, 情報学群, 教授 (30401243)
|
研究期間 (年度) |
2017-04-01 – 2023-03-31
|
キーワード | 分散処理フレームワーク |
研究実績の概要 |
令和3年度には,これまでに実施した研究によって得られた知見を,具体的な応用分野に適用することを目標として研究を行った.具体的には,深層強化学習フレームワークにおけるデータ処理のためのライブラリの開発に着手した. 深層強化学習は深層ニューラルネットワークを強化学習手法によって(自律的に)学習するもので,DeepMind社によるAlphaGoZeroやAlphaZeroなどの成果を受けて近年脚光を浴びている.深層強化学習を行うためのフレームワークはこれまでにもいくつか提案されている.そのようなフレームワークの例として,大規模な分散処理フレームワークとして Ray が,より簡易に利用できるフレームワークとして HandyRL などがある.それらは主に学習アルゴリズムの実装に主眼が置かれており,学習のために生成したデータをどのように保存・利用するかについてはユーザに任されていることが多い. それに対し,本研究では,深層強化学習のために生成したデータの保存と利用を簡易に記述することができるライブラリの開発を行うこととした.本年度は,そのようなライブラリの重要性について調査し,また小規模な学習タスクを具体的に実装することで,ライブラリのインターフェイスとして適切なものがどのようなものであるかを検討した.今後,バックグラウンドの実装方法について検討するとともに,これまでに本研究で実施したクエリ機構を組込むことの有効性などについて検討していく予定である.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
本研究課題に関連するまわりの状況を踏まえ,研究によって得られた知見をより具体的な応用分野に適用することを目指す研究へ方針を変更することとした. これまでに得られた知見については,国際学会などで発表・議論することを狙っていたが,これについては新型コロナの影響により十分に実施できていない.
|
今後の研究の推進方策 |
新しく開発することとした深層強化学習向けのデータ処理ライブラリについて,そのインターフェイスはおよそ定まってきた.今後は,バックグラウンドの実装方法について検討するとともに,これまでに本研究で実施した分散クエリ機構を組込む方法について検討・実装し,有効性などを評価していきたい.
|
次年度使用額が生じた理由 |
新型コロナウイルス感染拡大によって国際会議等への出席が困難となっているため.状況が改善した後に,当初予定していた国際会議等へ参加することを計画している.
|