2021 Fiscal Year Annual Research Report
Construction of Japanese Predicate-Argument Structure Dictionary for Natural Language Processing and Linguistic Analysis with Concordancer
Project/Area Number |
19K00552
|
Research Institution | Okayama University |
Principal Investigator |
竹内 孔一 岡山大学, 自然科学学域, 准教授 (80311174)
|
Project Period (FY) |
2019-04-01 – 2022-03-31
|
Keywords | PropBank形式 / 意味役割 / 概念フレーム / 深層学習 / BERT / prolog / コンコーダンサ / ブロックベース |
Outline of Annual Research Achievements |
今年度は述語項構造辞書の整備,概念フレームと意味役割を付与したデータを利用した意味役割付与モデルの構築,コンコーダンサシステムの改善を行った. 述語項構造辞書の概念フレームと意味役割を文書に対して付与する作業において,辞書の記述が不足している点がある場合に辞書を修正して更新した.また辞書に登録がない述語や概念フレームを新たに定義し登録した. 概念フレームと意味役割を付与した例文を利用して意味役割を推定する新たなモデルを構築した.まずベイジアンネットワークモデルを導入して,現在公開しているルールベースの意味役割付与手法と比較し,わずかながら意味役割付与の精度が向上することを確認した.一方で,概念フレームの付与精度は従来のルールベースの方が精度が高かった.また,ベイジアンネットワークの実装モデルの速度が遅く,起動にも時間を要することから,さらにモデルを検討する必要があることがわかった.異なる手法として,深層学習モデルBERTをencoderとして利用し,意味役割のタグ列を系列ラベリングのモデルであるCRFを利用して推定するモデルを作成してその付与精度を検討した.このモデルについては国内の会議で発表した. コンコーダンサについて,昨年度構築したシステムを更新し,実用ツールとして利用する際に必要となる機能を追加した.具体的には,検索ブロックをユーザが作成できるように,検索対象の文書に対して,内部でどのような意味役割や品詞などの情報が付与されているのかをテキストとグラフを利用した表示でユーザに提示する機能を作成した.また,表示機能の拡充し,KWIC表示,強調表示など複数表示ができるように内部のコードを整理した.作成したコンコーダンサシステムのデモサイトを構築した. さらに,ブロックを単位とした検索パターンの組合せによって様々な検索が可能であることを整理して国内会議で発表した.
|
Remarks |
ブロックベースの文書検索デモサイト 予告なく停止や更新など行うことがある.
|
Research Products
(3 results)