技術文書中の画像と説明文の対応付けによる知識体系の構築

研究課題

研究課題/領域番号	22K12154
研究種目	基盤研究(C)
配分区分	基金
応募区分	一般
審査区分	小区分61030:知能情報学関連
研究機関	中央大学
研究代表者	難波英嗣中央大学, 理工学部, 教授 (50345378)
研究期間 (年度)	2022-04-01 – 2025-03-31
研究課題ステータス	交付 (2023年度)
配分額 *注記	4,160千円 (直接経費: 3,200千円、間接経費: 960千円) 2024年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円) 2023年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円) 2022年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
キーワード	特許 / 手順グラフ / 技術分析軸 / 技術動向マップ / フローチャート / 説明文生成 / 上位下位関係 / T5 / 論文 / 画像認識 / 自然言語処理 / 知識体系
研究開始時の研究の概要	特許や論文などの技術文書中の図表は、特許の内容を理解する上で非常に重要な役割を果たしている。本研究では、特許中の図表と自然言語によるその説明文を利用した特定分野の知識体系を構築する手法を提案する。特許要約には、その特許の内容を簡潔に表した自然言語による説明文と代表図面から構成されている。そこで、まず、自然言語処理技術と画像認識技術を用いて、説明文と代表図面の構造をそれぞれ解析し、構造を対応付ける。次に、内容の近い特許を収集し、それらの共通項を見つけることで、その分野固有の手順や装置の構成に関する知識を得る。
研究実績の概要	本研究では、特許中の図表と自然言語によるその説明文を利用した特定分野の知識体系を構築する手法を提案する。2023年度は、(1)フローチャート画像とその説明文からのグラフの自動生成および手順オントロジーの自動構築、(2)特許からの技術分析軸の自動抽出に取り組んだ。 (1)について、提案手法は、まず、GPT-4 Turbo with visionを用いて、フローチャート画像と要約から手順情報を抽出し、ノード間の関係を示す手順グラフを生成する。次に、特定分野の複数の特許から抽出された手順グラフを統合し、手順オントロジーを構築した。提案手法の有効性を調べるため、実験を行った。実験では、自動運転に関する特許686件を用いて、各特許から手順グラフを構築し、その結果をダイアグラム生成ツールMermaid Live Editorで統合した。実験の結果、視認性の高い手順グラフを生成することができたが、類似するノードの同定がまだ十分でないことが確認された。 (2)について、特定分野の特許から技術分析軸を自動生成し、その分野の特許を自動分類する手法を提案した。提案手法では、まず、各特許から、課題、用途、解決手段に関する情報を抽出し、次に、GPT-4 Turboを用いて、4階層の技術分析軸を自動生成する。最後に、技術分析軸に特定分野の特許を自動分類する。実験の結果、自動生成された技術分析軸は、人間の専門家によるものとある程度一致することが確認された。
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由 2023年度に実施予定であった特許分類を用いた知識体系の構築については、まだ改良が必要であるが、2024年度に実施予定の特許出願調査報告書との比較による知識体系の有効性の評価については、2023年度から取り組みを開始しているため、全体としてはおおむね順調に進展していると判断できる。
今後の研究の推進方策	2023年度に実施予定であった特許分類を用いた知識体系の構築については、複数の特許から生成された手順グラフの統合方法について2024年度も引き続き検討する。さらに、2024年度は、特許出願調査報告書との比較による知識体系の有効性の評価について、2023年度に引き続き検討していく。

報告書

(2件)

2023 実施状況報告書
2022 実施状況報告書

研究成果
(7件)

すべて 2023 2022

すべて学会発表 (7件) (うち国際学会 3件)

[学会発表] Automatic Generation of Explanatory Text from Flowchart Images in Patents2023
- 著者名/発表者名
  Nanba, H., Kubo, S., and Fukuda, S.
- 学会等名
  the 4th Workshop on Patent Text Mining and Semantic Technologies (PatentSemTech 2023) in conjunction with SIGIR 2023
- 関連する報告書
  2023 実施状況報告書
- 国際学会
[学会発表] Automatic Multilingual Hypernym-Hyponym Relation Extraction Using a Link Prediction Model2023
- 著者名/発表者名
  Iwakuma, K., Gong, Y., Nanba, H., and Fukuda, S.
- 学会等名
  the 14th International Conference on Advanced Applied Informatics (IIAI AAI 2023)
- 関連する報告書
  2023 実施状況報告書
- 国際学会
[学会発表] Japanese Patent Classification Using Few-shot Learning2023
- 著者名/発表者名
  Hachisuka, S., Nakada, Y., Nanba, H., and Fukuda, S.
- 学会等名
  the 14th International Conference on Advanced Applied Informatics (IIAI AAI 2023)
- 関連する報告書
  2023 実施状況報告書
- 国際学会
[学会発表] 画像とテキストからの手順オントロジーの自動構築2023
- 著者名/発表者名
  菊池泰成，福田悟志，難波英嗣
- 学会等名
  情報処理学会第86回全国大会
- 関連する報告書
  2023 実施状況報告書
[学会発表] リンク予測モデルによる多言語上位下位関係の自動抽出2023
- 著者名/発表者名
  Yao Gong，福田悟志，難波英嗣
- 学会等名
  情報処理学会第149回情報基礎とアクセス技術研究会
- 関連する報告書
  2022 実施状況報告書
[学会発表] 特許中のフローチャート画像からの説明文の自動生成2023
- 著者名/発表者名
  難波英嗣，久保翔平，福田悟志
- 学会等名
  第150回情報基礎とアクセス技術研究会
- 関連する報告書
  2022 実施状況報告書
[学会発表] Analyzing the Structure of U.S. Patents Using Patent Families2022
- 著者名/発表者名
  Nakamitsu, J., Fukuda, S., and Nanba, H.
- 学会等名
  Proceedings of the 12rd International Conference on Advanced Applied Informatics (IIAI AAI 2022)
- 関連する報告書
  2022 実施状況報告書

技術文書中の画像と説明文の対応付けによる知識体系の構築

研究代表者

難波 英嗣 中央大学, 理工学部, 教授 (50345378)

4,160千円 (直接経費: 3,200千円、間接経費: 960千円)

現在までの達成度 (区分)

理由

報告書

研究成果

[学会発表] Automatic Generation of Explanatory Text from Flowchart Images in Patents2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Automatic Multilingual Hypernym-Hyponym Relation Extraction Using a Link Prediction Model2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Japanese Patent Classification Using Few-shot Learning2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] 画像とテキストからの手順オントロジーの自動構築2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] リンク予測モデルによる多言語上位下位関係の自動抽出2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] 特許中のフローチャート画像からの説明文の自動生成2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Analyzing the Structure of U.S. Patents Using Patent Families2022

著者名/発表者名

学会等名

関連する報告書

難波英嗣中央大学, 理工学部, 教授 (50345378)