• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2021 Fiscal Year Annual Research Report

Construction of Japanese Predicate-Argument Structure Dictionary for Natural Language Processing and Linguistic Analysis with Concordancer

Research Project

Project/Area Number 19K00552
Research InstitutionOkayama University

Principal Investigator

竹内 孔一  岡山大学, 自然科学学域, 准教授 (80311174)

Project Period (FY) 2019-04-01 – 2022-03-31
KeywordsPropBank形式 / 意味役割 / 概念フレーム / 深層学習 / BERT / prolog / コンコーダンサ / ブロックベース
Outline of Annual Research Achievements

今年度は述語項構造辞書の整備,概念フレームと意味役割を付与したデータを利用した意味役割付与モデルの構築,コンコーダンサシステムの改善を行った.
述語項構造辞書の概念フレームと意味役割を文書に対して付与する作業において,辞書の記述が不足している点がある場合に辞書を修正して更新した.また辞書に登録がない述語や概念フレームを新たに定義し登録した.
概念フレームと意味役割を付与した例文を利用して意味役割を推定する新たなモデルを構築した.まずベイジアンネットワークモデルを導入して,現在公開しているルールベースの意味役割付与手法と比較し,わずかながら意味役割付与の精度が向上することを確認した.一方で,概念フレームの付与精度は従来のルールベースの方が精度が高かった.また,ベイジアンネットワークの実装モデルの速度が遅く,起動にも時間を要することから,さらにモデルを検討する必要があることがわかった.異なる手法として,深層学習モデルBERTをencoderとして利用し,意味役割のタグ列を系列ラベリングのモデルであるCRFを利用して推定するモデルを作成してその付与精度を検討した.このモデルについては国内の会議で発表した.
コンコーダンサについて,昨年度構築したシステムを更新し,実用ツールとして利用する際に必要となる機能を追加した.具体的には,検索ブロックをユーザが作成できるように,検索対象の文書に対して,内部でどのような意味役割や品詞などの情報が付与されているのかをテキストとグラフを利用した表示でユーザに提示する機能を作成した.また,表示機能の拡充し,KWIC表示,強調表示など複数表示ができるように内部のコードを整理した.作成したコンコーダンサシステムのデモサイトを構築した.
さらに,ブロックを単位とした検索パターンの組合せによって様々な検索が可能であることを整理して国内会議で発表した.

Remarks

ブロックベースの文書検索デモサイト
予告なく停止や更新など行うことがある.

  • Research Products

    (3 results)

All 2022 Other

All Presentation (2 results) Remarks (1 results)

  • [Presentation] ブロック形式を利用したパターンマッチシステムの構築2022

    • Author(s)
      竹内孔一, 小笠原崇, 岡田魁人, 今田将也
    • Organizer
      言語処理学会第28回年次大会
  • [Presentation] 意味役割と概念フレームを付与したNPCMJ-PTによるタグの推定2022

    • Author(s)
      竹内孔一, アラステアバトラー, 長崎郁, プラシャントパルデシ
    • Organizer
      情報処理学会 第146回情報基礎とアクセス技術/第124回ドキュメントコミュニケーション研究会合同研究発表会
  • [Remarks] ASAGAO

    • URL

      https://asa-gao.com/

URL: 

Published: 2022-12-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi