2021 年度実施状況報告書

強化学習に適した並列分散機械学習環境の研究

研究課題

研究課題/領域番号	19K11994
研究機関	国立研究開発法人産業技術総合研究所
研究代表者	中田秀基国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 上級主任研究員 (80357631)
研究期間 (年度)	2019-04-01 – 2023-03-31
キーワード	強化学習 / 機械学習 / 並列システム / 分散システム
研究実績の概要	昨年度に引き続き、強化学習に適した分散システムの実装言語としてJulia言語に着目し研究を進めた。JuliaはREPLを持つ、スクリプト言語的に使用できる言語だが、強力なJITコンパイルによって、場合によってはC言語に匹敵する実行速度を実現する事ができ、次世代の機械学習向け言語として期待されている。Juliaには並列分散実行機構がデフォルトで提供されている。この機能は、リモートでの関数実行や、ループの自動並列化などを提供しているが、リモート計算機にデータを保持しておきそれに対する計算を継続的に行うような用途には適していない。われわれの目指す強化学習の並列実装においては、大規模なモデルをリモート計算機に配置しておき、そのデータを利用することが重要であるため、Juliaの既存では不十分である。またJuliaはコルーチン機構を提供している。コルーチンはいわば軽量なスレッドであり、これを用いるとI/O待ちを行うコンテクストを、同時に多数保持することができる。われわれはJuliaがもともと提供する並列分散実行機能と、コルーチン機構とを組み合わせることで、アクター機構を構築した。アクター機構はリモートデータとそのデータに対する処理をカプセル化したもので、リモートデータに対して非同期にメッセージを送ることで処理を起動する機構である。これを用いることで、分散環境でも強化学習機構を効率的に実装することが可能となる。さらに、分散環境で実行する機械学習ソフトウェアの実装もすすめた。
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由 Julia環境でのアクターモデルの実装をすすめた。アクターモデルでは処理対象のデータがアクターという単位でカプセル化され、アクセスがアクターへのメッセージという形でシリアライズされるため、アクター内部での排他制御の必要がなく、プログラマへの記述負荷が少ない。また、いわゆるオブジェクト指向言語と類似した書き方になるため、オブジェクト指向言語に慣れ親しんだプログラマにとっては負担が少ない。このアクター実装に関しては研究会発表を行っている。強化学習プログラマをアクターで実装するためには、強化学習の対象となる環境をアクターとして表現する。この環境アクターは、状態と行動の対を与えるとその行動に対する報酬を返す。一般にこの過程には環境のシミュレーションが伴うため、特に複雑な力学モデルを伴うような環境においては計算コストが非常に高い。このため、環境アクターに対して逐次的に問い合わせを行うと、環境でのシミュレーションがボトルネックとなり、学習機がほとんど機能しなくなる。このため十分なスピードで学習させることができない。これに対して、環境を表現するアクターを多数用意し、それらに対して非同期的に同時に環境をシミュレートすることで強化学習を高速化する事ができる。このようなシステムの実装を補助する汎用強化学習フレームワークをアクターモデル上に構築する実装をすすめている。本件に関しては研究会発表を行う予定である。
今後の研究の推進方策	これまでに構築したアクター機構の上に、汎用強化学習フレームワークを実装する。このフレームワークは、環境と強化学習アルゴリズムの双方をプラグイン可能に設計されている。環境を構築する際には、環境のモデルを用意し入力(状態とアクション)に対する報酬を定義する。一方で、強化学習アルゴリズムは、状態と報酬に対してアクションを返すコードとして定義する。環境はアクターとしてラップされ、複数の環境が分散並列に実行される。この際通信や並列制御はプログラマから隠蔽されるので、困難な並列分散実装の細部にとらわれることなく、モデルと強化学習アルゴリズムの実装を行うことができる。さらに、これまでに知られている基本的な強化学習アルゴリズムを予め実装として提供する。これによってプログラマの負荷を削減するとともに、プログラマが同じ問題に対して適切なアルゴリズムを選択することが容易になる。これらの補助を行うことで、これまで適用されてこなかった、さまざまな問題への容易な強化学習の適用が可能になる。 Julia言語はPythonのパッケージを呼び出すことが可能である。この機能を用いることで、Pythonで構築された強化学習の環境をそのままJuliaから利用することができる。たとえばOpenAIの公開している強化学習環境であるGymを、提案するフレームワークで利用することが可能になる。これによって、同じ対象に対してアルゴリズムの優劣を比較することができる。
次年度使用額が生じた理由	コロナの影響により計画していた研究会等への参加ができなかったため差額が生じた。

研究成果
(12件)

すべて 2021

すべて学会発表 (12件) (うち国際学会 4件)

[学会発表] Julia言語へのActorの導入2021
- 著者名/発表者名
  中田秀基
- 学会等名
  情報処理学会プログラミング研究会
[学会発表] A Method to Generate Posed Person Image with few Context Images2021
- 著者名/発表者名
  Hidemoto Nakada, Hideki Asoh
- 学会等名
  IMCOM 2022, The 16th International Conference on Ubiquitous Information Management and Communication
- 国際学会
[学会発表] Few Shot Model based on Weight Imprinting with Multiple Projection Head2021
- 著者名/発表者名
  Paulino Cristovao, Hidemoto Nakada, Yusuke Tanimura, Hideki Asoh
- 学会等名
  IMCOM 2022, The 16th International Conference on Ubiquitous Information Management and Communication
- 国際学会
[学会発表] Variational Information Bottleneck on Few Shot Model based on Weight Imprinting for Image Classification2021
- 著者名/発表者名
  Paulino Cristovao, Hidemoto Nakada, Yusuke Tanimura, Hideki Asoh
- 学会等名
  2021 ASIAN CONFERENCE ON INNOVATION IN TECHNOLOGY
- 国際学会
[学会発表] A study on the effect of regularization for weight imprinting2021
- 著者名/発表者名
  Paulino Cristovao, Hidemoto Nakada, Yusuke Tanimura, Hideki Asoh
- 学会等名
  2021年度人工知能学会全国大会 (第35回)
[学会発表] Performance of Domain Adaptation Schemes in Video Action Recognition using Synthetic Data2021
- 著者名/発表者名
  Hana Isoi, Atsuko Takefusa, Hidemoto Nakada, Masato Oguchi
- 学会等名
  The 2022 4th International Conference on Image, Video and Signal Processing (IVSP 2022)
- 国際学会
[学会発表] 合成データを用いた教師なしドメイン適応による室内動作認識手法の比較2021
- 著者名/発表者名
  礒井葉那, 竹房あつ子, 中田秀基, 小口正人
- 学会等名
  情報処理学会第84回全国大会
[学会発表] 合成データを用いた教師なしドメイン適応による室内動作認識手法の検討2021
- 著者名/発表者名
  礒井葉那, 竹房あつ子, 中田秀基, 小口正人
- 学会等名
  第14回データ工学と情報マネジメントに関するフォーラム (DEIM)
[学会発表] 合成動画データを用いた学習でのドメイン適応による動作認識精度の比較2021
- 著者名/発表者名
  礒井葉那, 竹房あつ子, 中田秀基, 小口正人
- 学会等名
  第24回画像の認識・理解シンポジウム
[学会発表] 動作認識のための合成データ活用に向けたドメイン適応手法の比較2021
- 著者名/発表者名
  礒井葉那, 竹房あつ子, 中田秀基, 小口正人
- 学会等名
  「マルチメディア、分散、協調とモバイル(DICOMO2021)シンポジウム」
[学会発表] 動作認識のための合成データ活用に向けたドメイン適応手法の検討2021
- 著者名/発表者名
  礒井葉那, 竹房あつ子, 中田秀基, 小口正人
- 学会等名
  信学技報 PRMU2021-5(2021-05)
[学会発表] MIDI note embedding with fasttext model2021
- 著者名/発表者名
  Yingfeng Fu, Yusuke Tanimura, Hidemoto Nakada
- 学会等名
  2021年度人工知能学会全国大会 (第35回)

2021 年度 実施状況報告書

強化学習に適した並列分散機械学習環境の研究

研究代表者

中田 秀基 国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 上級主任研究員 (80357631)

現在までの達成度 (区分)

理由

研究成果

[学会発表] Julia言語へのActorの導入2021

著者名/発表者名

学会等名

[学会発表] A Method to Generate Posed Person Image with few Context Images2021

著者名/発表者名

学会等名

[学会発表] Few Shot Model based on Weight Imprinting with Multiple Projection Head2021

著者名/発表者名

学会等名

[学会発表] Variational Information Bottleneck on Few Shot Model based on Weight Imprinting for Image Classification2021

著者名/発表者名

学会等名

[学会発表] A study on the effect of regularization for weight imprinting2021

著者名/発表者名

学会等名

[学会発表] Performance of Domain Adaptation Schemes in Video Action Recognition using Synthetic Data2021

著者名/発表者名

学会等名

[学会発表] 合成データを用いた教師なしドメイン適応による室内動作認識手法の比較2021

著者名/発表者名

学会等名

[学会発表] 合成データを用いた教師なしドメイン適応による室内動作認識手法の検討2021

著者名/発表者名

学会等名

[学会発表] 合成動画データを用いた学習でのドメイン適応による動作認識精度の比較2021

著者名/発表者名

学会等名

[学会発表] 動作認識のための合成データ活用に向けたドメイン適応手法の比較2021

著者名/発表者名

学会等名

[学会発表] 動作認識のための合成データ活用に向けたドメイン適応手法の検討2021

著者名/発表者名

学会等名

[学会発表] MIDI note embedding with fasttext model2021

著者名/発表者名

学会等名

2021 年度実施状況報告書

中田秀基国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 上級主任研究員 (80357631)