2023 Fiscal Year Research-status Report

常識・行動・領域知識に基づき家庭内行動を推論する対話エージェントシステムの開発

Research Project

Project/Area Number	23K11221
Research Institution	Aoyama Gakuin University
Principal Investigator	森田武史青山学院大学, 理工学部, 教授 (50590171)
Co-Investigator(Kenkyū-buntansha)	谷津元樹青山学院大学, 理工学部, 助教 (30805015) [Withdrawn]
Project Period (FY)	2023-04-01 – 2027-03-31
Keywords	Embodied AI / 知識グラフ / オントロジー / 大規模言語モデル / 常識推論 / 対話エージェント
Outline of Annual Research Achievements	本研究は，家庭シミュレータVirtualHome上で常識・行動・領域知識に基づき家庭内行動を推論する対話エージェントシステムを開発するものである．2023年度は，大規模言語モデル（LLM），家庭・行動知識に基づいて，ユーザの曖昧な要求からその要求の実現に必要なVirtualHome内の場所を案内可能なプロトタイプシステムを開発し，知識グラフに基づく先行研究システムとの比較評価を行った．先行研究で構築した評価用データセットを用いて評価した結果，提案システムが先行研究システムをF1値で上回ることを確認した．本評価結果より，LLMを常識知識推論や対話モジュールとして利用できる可能性を示すことができた．本成果は，2024年度人工知能学会全国大会で発表する予定である．さらに，本研究の基礎研究として，知識グラフ（Wikidata）を対象とした日本語エンティティリンキング（EL）と抽象的なタスク記述からVirtualHome上で実行可能なアクションスクリプト（AS）を自動生成する手法も研究した． EL研究の多くは英語を対象としており，日本語を対象とするEL研究は少ない．また，Wikidataを対象とした日本語EL評価用データセットは著者の知る限り存在しない．そこで，英語EL評価用データセットを日本語に自動翻訳し，提案する日本語EL手法の評価に用いた．評価実験より，提案手法が既存の多言語ELモデルをF1値で上回ることを確認した．自然言語文からASを自動生成する研究は行われているが，それらのASの実行率は約40%である．本研究では，LLMに行動と家庭知識を与え，抽象的なタスク記述から詳細な記述を生成し，詳細な記述からASを段階的に生成する手法を提案した．提案手法が生成したASの実行率は100%となり，既存手法と比べて実行率を大幅に向上できた．これらの成果を知識グラフに関する国際会議で発表した．
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason 2023年度は，大規模言語モデル（LLM）と家庭知識に基づいて，ユーザの曖昧な要求からその要求の実現に必要なVirtualHome内の場所を案内可能なプロトタイプシステムを開発した．知識グラフで表現された家庭環境知識や常識推論モデルをLLMで代替できるかは不明であったが，LLM研究の進展により，想定していたよりも早く，LLMに基づくプロトタイプシステムを開発することができた．また，提案システムは知識グラフに基づく先行研究システムをF1値で上回ることができた．さらに，本研究の基礎研究として，知識グラフ（Wikidata）を対象とした日本語エンティティリンキング（EL）と抽象的なタスク記述からVirtualHome上で実行可能なアクションスクリプト（AS）を自動生成する手法を研究し，知識グラフに関する国際会議で成果が発表できた．以上より，本研究課題はおおむね順調に進展している．
Strategy for Future Research Activity	現状のプロトタイプシステムは，先行研究において構築した評価用データセットに基づいて評価をしているが，この評価用データセットは，家庭環境におけるユーザの潜在的な要求の体系的な分析に基づいて構築できていない．また，潜在的な要求の中には，家庭環境や行動知識を参照しなくても，LLMが備える常識知識推論のみで回答できるものも含まれていると考えられる．以上より，今後は，家庭環境におけるユーザの潜在的な要求を体系的に分析し，家庭環境と行動知識を参照しなければ回答できないユーザの潜在的要求を含む評価用データセットを構築し，提案システムの評価を進めたい．また，LLMの常識推論と質問応答能力についても，十分に分析ができていないため，知識グラフに基づく常識推論や質問応答の先行研究と比較し，LLMの利点や欠点を明らかにしていきたい．さらに，知識グラフを対象としたエンティティリンキング，抽象的なタスク記述からのアクションスクリプト生成，常識知識や領域知識の補完など，本研究の基礎研究も同時に進める予定である．
Causes of Carryover	2024年3月に参加・発表した人工知能学会セマンティックウェブとオントロジー研究会の開催場所が近隣だったため，旅費が少額となり，別予算で旅費を支出できたことにより，次年度使用額が生じた．次年度使用額については，国内会議や国際会議の参加費や旅費に使用する予定である．

Research Products
(10 results)

All 2024 2023

All Presentation (10 results) (of which Int'l Joint Research: 4 results)

[Presentation] Prediction of actions and places by the time series recognition from images with Multimodal LLM2024
- Author(s)
  Tomohiro Ogawa, Kango Yoshioka, Ken Fukuda, Takeshi Morita
- Organizer
  2024 IEEE 18th International Conference on Semantic Computing (ICSC), International Knowledge Graph Reasoning Challenge 2024
- Int'l Joint Research
[Presentation] Prediction of Actions and Objects through Video Analysis Using Stepwise Prompt2024
- Author(s)
  Tsukasa Hirano, Kengo Ozaki, Takeshi Morita
- Organizer
  2024 IEEE 18th International Conference on Semantic Computing (ICSC), International Knowledge Graph Reasoning Challenge 2024
- Int'l Joint Research
[Presentation] マルチモーダル大規模言語モデルと画像キャプションに基づく描画内容に即した併置型駄洒落の認識2024
- Author(s)
  浅野歴，森田武史，江上周作，鵜飼孝典，福田賢一郎
- Organizer
  人工知能学会第二種研究会第62回セマンティックウェブとオントロジー研究会
[Presentation] DBpediaオントロジーとGPTに基づくWikipediaの赤リンクを用いたDBpediaの拡張2024
- Author(s)
  森俊人，森田武史，鵜飼孝典，江上周作，福田賢一郎
- Organizer
  人工知能学会第二種研究会第62回セマンティックウェブとオントロジー研究会
[Presentation] Wikidataを対象とした大規模言語モデルに基づくエンティティリンキング2024
- Author(s)
  三辻史哉，澤村勇輝，森田武史
- Organizer
  人工知能学会第二種研究会第62回セマンティックウェブとオントロジー研究会
[Presentation] 日常生活行動知識グラフとRAGに基づく家庭内危険行動の理由と根拠提示システム2024
- Author(s)
  穴口史将，森田武史
- Organizer
  人工知能学会第二種研究会第62回セマンティックウェブとオントロジー研究会
[Presentation] シーングラフとGPTに基づく画像に関連する併置型駄洒落生成2024
- Author(s)
  後藤颯志，浅野歴，森田武史
- Organizer
  人工知能学会第二種研究会第62回セマンティックウェブとオントロジー研究会
[Presentation] Japanese Pointer Network based Entity Linker for Wikidata2023
- Author(s)
  Yuki Sawamura, Takeshi Morita, Shusaku Egami, Takanori Ugai, Ken Fukuda
- Organizer
  The 12th International Joint Conference on Knowledge Graphs (IJCKG2023)
- Int'l Joint Research
[Presentation] Automatic Action Script Generation to Improve Execution Rate based on LLM in VirtualHome2023
- Author(s)
  Jin Aoyama, Takeshi Morita, Takanori Ugai, Shusaku Egami, Ken Fukuda
- Organizer
  The 12th International Joint Conference on Knowledge Graphs (IJCKG2023)
- Int'l Joint Research
[Presentation] LLMを活用した抽象的なタスク記述からのVirtualHomeのためのアクションスクリプト自動生成2023
- Author(s)
  青山仁，森田武史，鵜飼孝典，江上周作，福田賢一郎
- Organizer
  人工知能学会第二種研究会第61回セマンティックウェブとオントロジー研究会

2023 Fiscal Year Research-status Report

常識・行動・領域知識に基づき家庭内行動を推論する対話エージェントシステムの開発

Principal Investigator

森田 武史 青山学院大学, 理工学部, 教授 (50590171)

Current Status of Research Progress

Reason

Research Products

[Presentation] Prediction of actions and places by the time series recognition from images with Multimodal LLM2024

Author(s)

Organizer

[Presentation] Prediction of Actions and Objects through Video Analysis Using Stepwise Prompt2024

Author(s)

Organizer

[Presentation] マルチモーダル大規模言語モデルと画像キャプションに基づく描画内容に即した併置型駄洒落の認識2024

Author(s)

Organizer

[Presentation] DBpediaオントロジーとGPTに基づくWikipediaの赤リンクを用いたDBpediaの拡張2024

Author(s)

Organizer

[Presentation] Wikidataを対象とした大規模言語モデルに基づくエンティティリンキング2024

Author(s)

Organizer

[Presentation] 日常生活行動知識グラフとRAGに基づく家庭内危険行動の理由と根拠提示システム2024

Author(s)

Organizer

[Presentation] シーングラフとGPTに基づく画像に関連する併置型駄洒落生成2024

Author(s)

Organizer

[Presentation] Japanese Pointer Network based Entity Linker for Wikidata2023

Author(s)

Organizer

[Presentation] Automatic Action Script Generation to Improve Execution Rate based on LLM in VirtualHome2023

Author(s)

Organizer

[Presentation] LLMを活用した抽象的なタスク記述からのVirtualHomeのためのアクションスクリプト自動生成2023

Author(s)

Organizer

森田武史青山学院大学, 理工学部, 教授 (50590171)