研究課題/領域番号 |
20K11942
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61030:知能情報学関連
|
研究機関 | 豊田工業大学 |
研究代表者 |
佐々木 裕 豊田工業大学, 工学(系)研究科(研究院), 教授 (60395019)
|
研究期間 (年度) |
2020-04-01 – 2024-03-31
|
キーワード | オントロジー / オントロジー形式アノテーション / 固有表現抽出 / 関係抽出 |
研究成果の概要 |
本研究は,文書からの情報抽出を対象に,オントロジー形式のアノテーションにより作成された訓練データの効果を検証するものである.オントロジー形式のアノテーションでは関係用語が対象とする2つの用語をそれぞれdomain, rangeによりリンクする. 主な成果として,交通教則文およびSemEval 2010タスク8データに対して,オントロジー形式のアノテーションを行ったことが挙げられる.作成した独自のデータセットに対して,深層学習モデルによる用語抽出・関係イベント抽出の評価実験を行い,オントロジー形式のアノテーションの効果を明らかにした.本成果はIF=4.3の国際論文誌に掲載された.
|
自由記述の分野 |
自然言語処理
|
研究成果の学術的意義や社会的意義 |
オントロジー形式の関係アノテーションを考案し,その効果を独自データセットの構築を通して確認した.日本発の新しいアノテーションを提案したことで,本分野の発展に寄与した.また,交通教則文に対して,オントロジー形式アノテーションを適用したデータセットを公開したことも貢献として挙げられる.英語のデータセットに関しても,関係抽出に関する標準データセットであるSemEval 2010 タスク8データの8,000文に対してオントロジー形式のアノテーションを行い,データセットを公開した.オントロジー形式のアノテーションは今後,言語データからオントロジーへの変換の橋渡しとなることが期待される.
|