• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2023 年度 実績報告書

オントロジー形式による関係アノテーションとその効果の深層学習による検証

研究課題

研究課題/領域番号 20K11942
研究機関豊田工業大学

研究代表者

佐々木 裕  豊田工業大学, 工学(系)研究科(研究院), 教授 (60395019)

研究期間 (年度) 2020-04-01 – 2024-03-31
キーワード情報抽出 / オントロジー形式 / アノテーション / 深層学習
研究実績の概要

本研究は,文書からの情報抽出を対象に,オントロジー形式のアノテーションにより作成された訓練データの効果を検証するものである.従来の関係アノテーションは2つの用語間に関係を付与してきたが,オントロジー形式のアノテーションでは関係用語と対象となる2つの用語をそれぞれdomain, rangeによりリンクする.これにより,関係の種類が少なくなり,用語抽出として関係の種類が識別できるようになる.
1年目には,交通教則文すべてに対して,オントロジー形式のアノテーションを行った.また,BERTにより単語のベクトル化を行い,深層学習モデルによる用語・関係抽出の予備実験も実施した.
2年目には,英語の関係抽出データに対してオントロジー形式のアノテーションを行った.関係抽出データとして,SemEval 2010タスク8のデータを対象とした.このデータは従来形式による関係アノテーションが付与されており,対象用語e1, e2に対して関係Rが有向グラフとして付与されており,この r→e1, r→e2の間にdomain, rangeの関係をアノテーションし,その効果を深層学習モデルにより検証した.
3年目には,各種実験を行い,論文をIF=4.3の論文誌に投稿した.本研究の新しい試みとして,交通教則の文を正規化し,省略部分に対する遠隔の関係づけを低減する修正を行った.アノテーションの見直しは時間のかかる地道な作業であり,目立った成果ではないが研究的な価値は高い.これに沿ったアノテーションガイドラインの整備も実施した.
本研究課題は3年計画であり2022年度で終了する計画であったが,コロナ禍の影響により実験や論文の作成は3年間で完了できたが,データを最終的に整備する作業に十分な時間をかけることができなかった.そこで特例措置に基づき1年間延長を認めていただき,2024年度にデータ整備を行った.

  • 研究成果

    (1件)

すべて 2024

すべて 雑誌論文 (1件) (うち査読あり 1件、 オープンアクセス 1件)

  • [雑誌論文] Two evaluations on Ontology-style relation annotations2024

    • 著者名/発表者名
      Bou Savong、Miwa Makoto、Sasaki Yutaka
    • 雑誌名

      Computer Speech & Language

      巻: 84 ページ: 101569~101569

    • DOI

      10.1016/j.csl.2023.101569

    • 査読あり / オープンアクセス

URL: 

公開日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi