研究課題/領域番号 |
23K24910
|
補助金の研究課題番号 |
22H03654 (2022-2023)
|
研究種目 |
基盤研究(B)
|
配分区分 | 基金 (2024) 補助金 (2022-2023) |
応募区分 | 一般 |
審査区分 |
小区分61030:知能情報学関連
|
研究機関 | 国立研究開発法人理化学研究所 |
研究代表者 |
吉野 幸一郎 国立研究開発法人理化学研究所, 情報統合本部, チームリーダー (70760148)
|
研究分担者 |
須藤 克仁 奈良女子大学, 生活環境科学系, 教授 (00396152)
横井 祥 東北大学, 情報科学研究科, 助教 (60888949)
中村 泰 国立研究開発法人理化学研究所, 情報統合本部, チームリーダー (70403334)
|
研究期間 (年度) |
2022-04-01 – 2026-03-31
|
研究課題ステータス |
交付 (2024年度)
|
配分額 *注記 |
17,290千円 (直接経費: 13,300千円、間接経費: 3,990千円)
2025年度: 3,770千円 (直接経費: 2,900千円、間接経費: 870千円)
2024年度: 4,030千円 (直接経費: 3,100千円、間接経費: 930千円)
2023年度: 4,940千円 (直接経費: 3,800千円、間接経費: 1,140千円)
2022年度: 4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)
|
キーワード | 言語ロボティクス / 知識推論 / 言語モデル / 状況理解 / 自然言語処理 / 対話ロボット / 対話システム / 埋込表現 / 分散表現 / 対話 / ロボット / 動作生成 / ロボット対話 / 実世界接地 / 知能ロボティクス / 埋め込み表現 / 知識獲得 |
研究開始時の研究の概要 |
人間の生活空間という実世界で補助タスクを行うロボットに対し、テキストで記述された知識を用いた知識推論を導入することで、様々な常識推論を可能にする知能ロボットシステムの構築を行う。この中で、実世界でロボットが観測した事物に応じて、知識推論基盤を柔軟に更新し、ロボット自身が経験から知識推論を新しくすることができる枠組みについて研究する。ここで用いる知識推論基盤、埋め込み表現と知識推論機構において、実世界における時間的・空間的なコンテキストを取り込み、テキストに記述された内容だけでなく、実世界のコンテキストを幅広く用いることができる知識推論基盤の構築を目指す。
|
研究実績の概要 |
人間の生活空間という実世界で補助タスクを行うロボットに対し、テキストで記述された知識を用いた知識推論を導入することで、様々な常識推論を可能にする知能ロボットシステムの構築を行う。この中で、実世界でロボットが観測した事物に応じて、知識推論基盤を柔軟に更新し、ロボット自身が経験から知識推論を新しくすることができる枠組みについて研究する。ここで用いる知識推論基盤、埋め込み表現と知識推論機構において、実世界における時間的・空間的なコンテキストを取り込み、テキストに記述された内容だけでなく、実世界のコンテキストを幅広く用いることができる知識推論基盤の構築を目指す。 本年度においては、実世界でのコンテキストを反映した知識推論モデルの構築や、このための埋め込み表現の研究を行った。まず、実世界の観測から得られたコンテキストによって知識推論を行う枠組みを構築し利用した。これをロボットに対して適用し、実空間のコンテキストに応じて実空間の事物やその関係について利活用した。構築された埋め込み・知識推論モデルに基づいて、ロボットが実世界から得られた観測に基づいて推論を行い、行動を決定するようなモデルを構築した。具体的には、これまでに本プロジェクトで構築した気が利くロボットのデータセットを用い、周囲の環境情報や知識推論の結果などによってロボットが行うべき行動を決定するモデルの構築を行った。この成果は国際誌の査読付き論文誌に掲載された。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
今年度はこれまでに定義してきた「気の利くロボット」に関するデータを用いて、気が利くロボットの行動を推論して導く知識推論モデルの構築および評価を行った。また、データセットの拡張も行った。ロボットの動作に関わるモデルとしては近年大規模言語モデルや事前学習モデルの利活用が注目されており、本課題においてもこうしたモデルの利活用を行った。その結果、ロボットが持つ周辺環境に関して様々な情報を明示的に推論へと導くことで、気の利くロボットの行動決定モデルの精度が大幅に強化されることがわかった。本内容は国際論文誌に投稿し掲載された。また、ロボットが行う演繹的な推論過程についての研究も行い、知識推論を用いた演繹的推論の利活用が、ナイーブな言語モデルや事前学習モデルの利活用よりも有効であり、またロボットの思考過程をユーザに提示する上でも有効であることが示された。これらのロボットシステムで用いる分散表現などに関わる基盤としては、分散表現にいくつかの観点を持ち込んで学習を行うモデルの有効性を示すことができ、これを査読付き国際会議で発表した。また、言語とロボットの融合という観点で言語処理学会2024年年次大会において「大規模言語モデルの実世界応用」ワークショップを主催し、非常に多くの参加者と有意義な議論を行うことができた。
|
今後の研究の推進方策 |
今年度は「気の利くロボット」の実現にあたり、実際に知識推論基盤を利活用するなど大きな進展があった。また一方で、世間としては大規模言語モデルの利活用が非常な注目を浴びるようになっており、そうした枠組みとの有機的な融合が期待される状況になりつつある。ロボット用の基盤モデルについて考えた場合、ロボットの一人称視点から得られる様々なセンサーデータと、ロボットのモーションから得られる軌跡などのデータを言語と結び付ける必要がある。こうした観点について、モデル学習とモデルにおける推論双方を踏まえた研究議論を展開し、今後の言語×ロボティクスの研究の方向性を明らかにしたいと考えている。また、実際にそうした方向からロボットの基盤モデルとなりうる目的関数や表現形式についての議論を行い、いくつか有望なものを実装するフェーズに移りたい。
|