研究課題/領域番号 |
22K12723
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分90020:図書館情報学および人文社会情報学関連
|
研究機関 | 早稲田大学 |
研究代表者 |
林 良彦 早稲田大学, 理工学術院, 教授(任期付) (80379156)
|
研究期間 (年度) |
2022-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2024年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2023年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2022年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
|
キーワード | コモンセンス知識 / 知識グラフ / オントロジー / 多義性解消 / 文脈依存分散表現 |
研究開始時の研究の概要 |
人間が持つ常識的知識 (コモンセンス知識) を利用する研究が盛んである.代表的なコモンセンス知識グラフである ConceptNet の事前分析から,知識リソースとしての信頼性や有用性に関わる問題点があることが分かった.そこで本研究は,オントロジー工学に立脚する知見と先端的な自然言語処理技術に基づいてこれらの問題点を解消する手段を自然言語処理技術およびグラフ表現技術により実現し,オントロジー的に適度に制約されたコモンセンス知識リソースの構築・利用に関する知見を体系化することを目的とする
|
研究実績の概要 |
本研究は,具体的なコモンセンス知識リソースである ConceptNet を対象とし,オントロジー的に適度に制約されたコモンセンス知識リソースの構築・利用に関する知見を体系化することを目的としている. 初年度の2022年度は,すでに構築済のパイロットデータセットを用いて,知識トリプルの連鎖の妥当性評価を行うための手法の検討を中心に進めた.この課題は,2つのトリプルを結節点となる概念ノードを介して連鎖させることが意味的に適当であるかを判定するものであり,コモンセンス知識リソースを推論を伴う問題解決に適用する際に必須となる. 技術的には,自然言語処理における意味的多義性解消に類似しているが,必要な文脈情報が欠乏しているという問題がある.今年度は,知識リソースの局所的なグラフ構造,および,当該の知識トリプルを言語化し大規模言語モデルに基づく文脈依存分散表現を特徴量として利用する教師あり学習方式の実装・実験評価を行い,その基本的な有効性を確認するとともに,問題点を明確化した.また,以上の成果を国際会議 LREC2022 (2022年5月,フランス・マルセイユ市で開催)にて報告し,関連研究者との議論から今後の進め方に関する示唆を受けた. また,コモンセンス知識リソースをオントロジー的に適正な形に精錬するというサブ課題については,ConceptNetに収録されている概念ノード間関係の基本的な分析を進めた.とくに,XがYにある⇔YがXにある という AtLocation 関係の対称性についての妥当性についての検討を行っている.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
特に重要となるサブ課題である,知識トリプルの連鎖の妥当性評価に関して,教師あり学習による手法の有効性と問題点を確認した.
|
今後の研究の推進方策 |
本課題においては,静的なリソースであるコモンセンス知識グラフのグラフ構造を最大限に利用することが重要と考えており,これを利用した弱教師あり学習に基づく方式を開発する予定である.また,並行して,ChatGPTに代表される大規模言語モデルの適用可能性についても検討を進める.
|