再帰的強化学習を用いた言語理解・発話計画機構の開発

研究課題

研究課題/領域番号	22K12188
研究種目	基盤研究(C)
配分区分	基金
応募区分	一般
審査区分	小区分61040:ソフトコンピューティング関連
研究機関	国立研究開発法人産業技術総合研究所
研究代表者	一杉裕志国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (30356464)
研究分担者	佐野崇東洋大学, 情報連携学部, 准教授 (00710295) 中田秀基国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 招聘研究員 (80357631) 高橋直人国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (40357380) 竹内泉国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (20264583)
研究期間 (年度)	2022-04-01 – 2025-03-31
研究課題ステータス	交付 (2023年度)
配分額 *注記	4,160千円 (直接経費: 3,200千円、間接経費: 960千円) 2024年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円) 2023年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円) 2022年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
キーワード	階層型強化学習 / 認知アーキテクチャ / プログラム合成 / ベイジアンネットワーク / 計算論的神経科学 / 汎用人工知能 / 語用論 / 数理論理学 / 対話システム
研究開始時の研究の概要	本研究ではヒトのような合目的的な言語理解・発話計画を行う機構の基本原理を明らかにする。対話の目的は長期的な報酬期待値最大化であると仮定し、我々が開発した再帰的強化学習 RGoal を用いて、対話を行うための行動ルールを自律的に学習・実行する知的エージェントを実装する。さらに、エージェントの脳内のワーキングメモリの機構や、知識獲得を促進させるためにエージェントの脳・身体に備わる様々な機構を実装し、性能との関係を明らかにする。
研究実績の概要	本研究はヒトの言語理解の機構の本質的部分を抽象化した「模型」を作り、世に示すことを目的としている。また、知識獲得の性能を飛躍的に向上させるために、知的エージェントの脳・身体が持つべき機構を、神経科学・認知科学・言語学・論理学などの周辺分野の知見を参考にして明らかにする。「開発フレームワークの実装」に関しては、ＡＩエージェントが動作する環境の抽象度を高め、テストプログラムの記述を容易にすることを検討した。「ヒトが解くべきタスクの性質への対応」に関しては、自然言語を理解した結果を表現する心的表象に関して、状況意味論と似た表現を導入することを検討した。「アーキテクチャの実装と評価」に関しては、ＡＩエージェントの行動計画の機構を実装し、簡単なテストプログラムを用いて動作の確認を行った。また、設計中のＡＩエージェントのアーキテクチャについて、報酬最大化を目的とした行動計画・実行・対話・推論を行う機構として統一的に理解できることを示した。「アルゴリズムの効率化」に関しては、再帰的強化学習アルゴリズム RGoal に対し、サブルーチンの出口を複数持たせた上、例外終了も可能にする機能拡張を行い、ＡＩエージェントの行動ルールの表現力を向上させた。また、学習アルゴリズムに適格度トレースを入れることで、サブルーチン終了時の状態の価値をサブルーチン内部の状態の価値に反映させるようにした。「周辺分野の知見との関係の解明」に関しては、組み合わせ範疇文法による漸進的解析に関する研究、「だから」を含む自然言語の文における意味論に関する研究を行った。
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由実施計画で想定した開発が進み研究会発表などを行っているため、おおむね順調に進展していると言える。なお、再帰的強化学習アルゴリズム RGoal に関して、例外終了、適格度トレースの導入が必須であることが判明したため、それに対応したアルゴリズム設計に想定以上の時間を割いた。
今後の研究の推進方策	報酬最大化を目的とする言語理解・発話計画を行うＡＩアーキテクチャの設計とその要素技術の開発を引き続き行う。具体的には、人間の言語理解・発話計画を説明する関連性理論を POMDP (部分観測マルコフ決定過程)の枠組みを用いて定式化・拡張しその原理を明確化すること、再帰的強化学習アルゴリズム RGoal を用いた行動計画の機構の開発、ＡＩエージェントの行動ルール記述言語 Pro5Lang の宣言的記憶機構の改良や実行制御機構の改良、Pro5Lang で書かれた行動ルールを効率的にプログラム合成するためにエージェントの身体に作り込む反射・情動などの機構の開発、大規模化可能なベイジアンネット BESOM4 の効率的な推論・学習アルゴリズムの開発、言語学・論理学・神経科学などの知見との関係の解明などを行う。なお、2022年ごろから急速に注目を集めている ChatGPT などの LLM (大規模言語モデル)は本研究と非常に関連が深い。 LLM 関連技術とその応用および社会への普及状況についてキャッチアップしつつ、我々のアーキテクチャへの取り込む方法も検討する。また、現状の LLM に不足していると言われる、文章の深い理解・長期記憶・熟考・動機・継続学習・身体性などの機能を LLM に追加する手法の提案なども今後検討していく。急速に発展する AI を人類に役に立つ安全なものにするための「ＡＩアライメント」と呼ばれる分野についても強く関心を向けていく。

報告書

(2件)

2023 実施状況報告書
2022 実施状況報告書

研究成果
(15件)

すべて 2024 2023 2022

すべて雑誌論文 (12件) (うちオープンアクセス 10件、査読あり 2件) 学会発表 (3件) (うち招待講演 2件)

[雑誌論文] モンテカルロ版 RGoal アルゴリズムの改良2024
- 著者名/発表者名
  一杉裕志、中田秀基、高橋直人、竹内泉、佐野崇
- 雑誌名
  
  人工知能学会第二種研究会資料
  
  巻: 2023 号: AGI-026 ページ: 50-55
- DOI
  10.11517/jsaisigtwo.2023.AGI-026_50
- ISSN
  2436-5556
- 年月日
  2024-03-08
- 関連する報告書
  2023 実施状況報告書
- オープンアクセス
[雑誌論文] フランス語動詞補語の下位分類と組合せ範疇文法による漸進的解析2024
- 著者名/発表者名
  高橋直人、竹内泉、一杉裕志
- 雑誌名
  
  言語処理学会第30回年次大会予稿集
  
  巻: -
- 関連する報告書
  2023 実施状況報告書
- オープンアクセス
[雑誌論文] 前件強化による後件変更2024
- 著者名/発表者名
  竹内泉
- 雑誌名
  
  哲学誌
  
  巻: 66
- 関連する報告書
  2023 実施状況報告書
- 査読あり / オープンアクセス
[雑誌論文] 再帰的な階層型強化学習 RGoal へのサブルーチン例外終了機能の導入2023
- 著者名/発表者名
  一杉裕志、中田秀基、高橋直人、竹内泉、佐野崇
- 雑誌名
  
  人工知能学会第二種研究会資料
  
  巻: 2023 号: AGI-025 ページ: 08
- DOI
  10.11517/jsaisigtwo.2023.AGI-025_08
- ISSN
  2436-5556
- 年月日
  2023-11-05
- 関連する報告書
  2023 実施状況報告書
- オープンアクセス
[雑誌論文] 報酬最大化を目的とする行動計画・実行・対話・推論の統一的制御機構,2023
- 著者名/発表者名
  一杉裕志、中田秀基、高橋直人、竹内泉、佐野崇
- 雑誌名
  
  第37回人工知能学会全国大会予稿集
  
  巻: -
- 関連する報告書
  2023 実施状況報告書
[雑誌論文] 組合せ範疇文法によるドイツ語文の原因・結果関係の意味表示2023
- 著者名/発表者名
  高橋直人、一杉裕志、竹内泉
- 雑誌名
  
  言語処理学会第29回年次大会発表論文集
  
  巻: - ページ: 1901-1906
- 関連する報告書
  2022 実施状況報告書
- オープンアクセス
[雑誌論文] 組合せ範疇文法を用いたドイツ語文の漸進的解析2023
- 著者名/発表者名
  高橋直人、竹内泉、一杉裕志
- 雑誌名
  
  言語処理学会第29回年次大会発表論文集
  
  巻: - ページ: 1907-1912
- 関連する報告書
  2022 実施状況報告書
- オープンアクセス
[雑誌論文] 〈ならば〉と〈だから〉の意味論2023
- 著者名/発表者名
  竹内泉
- 雑誌名
  
  哲学誌
  
  巻: 65 ページ: 111-128
- 関連する報告書
  2022 実施状況報告書
- 査読あり / オープンアクセス
[雑誌論文] フレーム間差分を用いた画像セグメンテーション改善法の検討2023
- 著者名/発表者名
  河村聡太, 本多泰理, 中村周吾, 佐野崇
- 雑誌名
  
  情報処理学会、第85回全国大会
  
  巻: -
- 関連する報告書
  2022 実施状況報告書
- オープンアクセス
[雑誌論文] Julia言語を用いた高性能並列実行環境の構築2023
- 著者名/発表者名
  中田秀基
- 雑誌名
  
  情報処理学会第143回プログラミング研究会 CPSY2020-2,DC2020-2
  
  巻: 120 ページ: 9-14
- 関連する報告書
  2022 実施状況報告書
[雑誌論文] プログラム合成対象言語 Pro5Lang のための行動価値関数圧縮アルゴリズム2022
- 著者名/発表者名
  一杉裕志、中田秀基、高橋直人、竹内泉、佐野崇
- 雑誌名
  
  人工知能学会第二種研究会資料
  
  巻: 2022 号: AGI-022 ページ: 22
- DOI
  10.11517/jsaisigtwo.2022.AGI-022_22
- ISSN
  2436-5556
- 年月日
  2022-11-15
- 関連する報告書
  2022 実施状況報告書
- オープンアクセス
[雑誌論文] 報酬最大化ＡＧＩのための意思疎通機構の設計とプロトタイプ実装2022
- 著者名/発表者名
  一杉裕志、中田秀基、高橋直人、竹内泉、佐野崇
- 雑誌名
  
  人工知能学会第二種研究会資料
  
  巻: 2022 号: AGI-021 ページ: 02
- DOI
  10.11517/jsaisigtwo.2022.AGI-021_02
- ISSN
  2436-5556
- 年月日
  2022-07-14
- 関連する報告書
  2022 実施状況報告書
- オープンアクセス
[学会発表] 論理学は科学か、哲学か2023
- 著者名/発表者名
  竹内泉
- 学会等名
  日本科学哲学会第56回大会
- 関連する報告書
  2023 実施状況報告書
[学会発表] 確率的グラフィカルモデルにおける変分近似法2023
- 著者名/発表者名
  佐野崇
- 学会等名
  物理屋のための機械学習講義、第2回
- 関連する報告書
  2022 実施状況報告書
- 招待講演
[学会発表] Philosophers and AI2022
- 著者名/発表者名
  竹内泉
- 学会等名
  日本科学哲学会第55回大会
- 関連する報告書
  2022 実施状況報告書
- 招待講演

再帰的強化学習を用いた言語理解・発話計画機構の開発

研究代表者

一杉 裕志 国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (30356464)

4,160千円 (直接経費: 3,200千円、間接経費: 960千円)

現在までの達成度 (区分)

理由

報告書

研究成果

[雑誌論文] モンテカルロ版 RGoal アルゴリズムの改良2024

著者名/発表者名

雑誌名

DOI

ISSN

年月日

関連する報告書

[雑誌論文] フランス語動詞補語の下位分類と組合せ範疇文法による漸進的解析2024

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] 前件強化による後件変更2024

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] 再帰的な階層型強化学習 RGoal へのサブルーチン例外終了機能の導入2023

著者名/発表者名

雑誌名

DOI

ISSN

年月日

関連する報告書

[雑誌論文] 報酬最大化を目的とする行動計画・実行・対話・推論の統一的制御機構,2023

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] 組合せ範疇文法によるドイツ語文の原因・結果関係の意味表示2023

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] 組合せ範疇文法を用いたドイツ語文の漸進的解析2023

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] 〈ならば〉と〈だから〉の意味論2023

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] フレーム間差分を用いた画像セグメンテーション改善法の検討2023

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Julia言語を用いた高性能並列実行環境の構築2023

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] プログラム合成対象言語 Pro5Lang のための行動価値関数圧縮アルゴリズム2022

著者名/発表者名

雑誌名

DOI

ISSN

年月日

関連する報告書

[雑誌論文] 報酬最大化ＡＧＩのための意思疎通機構の設計とプロトタイプ実装2022

著者名/発表者名

雑誌名

DOI

ISSN

年月日

関連する報告書

[学会発表] 論理学は科学か、哲学か2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] 確率的グラフィカルモデルにおける変分近似法2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Philosophers and AI2022

著者名/発表者名

学会等名

関連する報告書

一杉裕志国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (30356464)