• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

Construction and Exploitation of Ontologically-sound Commonsense Knowledge Resources

Research Project

Project/Area Number 22K12723
Research Category

Grant-in-Aid for Scientific Research (C)

Allocation TypeMulti-year Fund
Section一般
Review Section Basic Section 90020:Library and information science, humanistic and social informatics-related
Research InstitutionWaseda University

Principal Investigator

林 良彦  早稲田大学, グリーン・コンピューティング・システム研究機構, その他(招聘研究員) (80379156)

Project Period (FY) 2022-04-01 – 2025-03-31
Project Status Granted (Fiscal Year 2023)
Budget Amount *help
¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000)
Fiscal Year 2024: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
Fiscal Year 2023: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
Fiscal Year 2022: ¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000)
Keywordsコモンセンス知識 / 知識グラフ / オントロジー / 多義性解消 / 大規模言語モデル / 文脈依存分散表現
Outline of Research at the Start

人間が持つ常識的知識 (コモンセンス知識) を利用する研究が盛んである.代表的なコモンセンス知識グラフである ConceptNet の事前分析から,知識リソースとしての信頼性や有用性に関わる問題点があることが分かった.そこで本研究は,オントロジー工学に立脚する知見と先端的な自然言語処理技術に基づいてこれらの問題点を解消する手段を自然言語処理技術およびグラフ表現技術により実現し,オントロジー的に適度に制約されたコモンセンス知識リソースの構築・利用に関する知見を体系化することを目的とする

Outline of Annual Research Achievements

本研究は,具体的なコモンセンス知識リソースである ConceptNet を対象とし,オントロジー的に適度に制約されたコモンセンス知識リソースの構築・利用に関する知見を体系化することを目的としている.2年目となる2023年度は,本研究課題における中心的な問題である「知識トリプルの連鎖の妥当性評価」の問題が自然言語処理における「意味的多義性解消」の問題と関連していることに着目し,主としてこの問題に取り組んだ.具体的には,特に異なる文脈における対象語の意味が同一であるかを判定する「Word-In-Context」(WiC) と呼ばれるタスクが深く関連していることに着目し,近年,非常な進展を見せている大規模言語モデル (LLM) を用いて,このタスクに取り組んだ.その結果,以下の知見を得た.
(1) LLMに対して適切にプロンプティングを行うことにより,LLMに内在する意味知識を言語化させることができ,これにより得た意味記述を分析することにより,最先端のLLM (特に GPT-4) は,WiCタスクにおいて有用かつ妥当な意味知識を有しているを明らかにした.
(2) この意味記述を学習データとして二値分類器を学習することにより,WiCタスクの精度が向上することを明らかにした.
(3) にもかかわらず,最も優れた LLM においては,ゼロショットでタスクを解かせた方が精度が高く,上記の言語化では表層化させきれない意味知識が内在している可能性が分かった.
(4) プロンプトを工夫することにより,LLMは意味の同一性の程度に関しても一定の感度を有することが分かった.
以上のうち,(1)から(3)の成果については,言語資源・計算言語学の代表的な国際会議である LREC-COING2024 (2024年5月 イタリア・トリノ市開催) にて発表を行い,関連研究者との議論を深める.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

コモンセンス知識グラフのオントロジー化の検討は当初予定より遅れているが,本課題において中心的な問題である「知識トリプルの連鎖の妥当性評価」に関して,大規模言語モデル(LLM) の適用に関する検討において一定の成果を得たため.

Strategy for Future Research Activity

2022年度より進めていた「知識トリプルの連鎖の妥当性評価」方式と,2023年度の WiCタスクに関する方式との統合を進め,全体的な精度向上に取り組む.また,コモンセンス知識グラフのグラフ構造の性質の分析を進めるとともに,特に underspecified な概念ノード間の関係の精密化についての検討を進める.

Report

(2 results)
  • 2023 Research-status Report
  • 2022 Research-status Report
  • Research Products

    (8 results)

All 2024 2023 2022 Other

All Journal Article (1 results) (of which Peer Reviewed: 1 results) Presentation (6 results) (of which Int'l Joint Research: 4 results) Remarks (1 results)

  • [Journal Article] Learning Bidirectional Translation Between Descriptions and Actions With Small Paired Data2022

    • Author(s)
      Minori Toyoda, Kanata Suzuki, Yoshihiko Hayashi, Tetsuya Ogata
    • Journal Title

      IEEE Robotics and Automation Letters

      Volume: 7 (3) Issue: 4 Pages: 10930-10937

    • DOI

      10.1109/lra.2022.3196159

    • Related Report
      2022 Research-status Report
    • Peer Reviewed
  • [Presentation] Reassessing Semantic Knowledge Encoded in Large Language Models using the Word-in-Context Tasks2024

    • Author(s)
      Yoshihiko Hayashi
    • Organizer
      The 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation
    • Related Report
      2023 Research-status Report
    • Int'l Joint Research
  • [Presentation] 対話型質問応答における質問書き換えのためのターン強調2023

    • Author(s)
      小堀智祥, 小林哲則, 林 良彦
    • Organizer
      言語処理学会第29回年次大会
    • Related Report
      2022 Research-status Report
  • [Presentation] 指定要約長に応じたソフトな内容選択による要約長操作可能なEnd-to-End要約2023

    • Author(s)
      楢木悠士, 小林哲則, 林 良彦
    • Organizer
      言語処理学会第29回年次大会
    • Related Report
      2022 Research-status Report
  • [Presentation] Towards the Detection of a Semantic Gap in the Chain of Commonsense Knowledge Triples2022

    • Author(s)
      Yoshihiko Hayashi
    • Organizer
      LREC2022, pp.298-304
    • Related Report
      2022 Research-status Report
    • Int'l Joint Research
  • [Presentation] Evaluating the Effects of Embedding with Speaker Identity Information in Dialogue Summarization2022

    • Author(s)
      Yuji Naraki, Tetsuya Sakai, Yoshihiko Hayashi
    • Organizer
      LREC2022, pp.298-304
    • Related Report
      2022 Research-status Report
    • Int'l Joint Research
  • [Presentation] Phrase-Level Localization of Inconsistency Errors in Summarization by Weak Supervision2022

    • Author(s)
      Masato Takatsuka, Tetsunori Kobayashi, Yoshihiko Hayashi
    • Organizer
      COLING2022, pp.6151-6164
    • Related Report
      2022 Research-status Report
    • Int'l Joint Research
  • [Remarks] Evaluating LLMs on the WiC (Word-in-Context) Task

    • URL

      https://github.com/yoshihikohayashi/wic_llm

    • Related Report
      2023 Research-status Report

URL: 

Published: 2022-04-19   Modified: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi