研究課題/領域番号 |
19K00552
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分02060:言語学関連
|
研究機関 | 岡山大学 |
研究代表者 |
竹内 孔一 岡山大学, 自然科学学域, 准教授 (80311174)
|
研究期間 (年度) |
2019-04-01 – 2022-03-31
|
研究課題ステータス |
完了 (2021年度)
|
配分額 *注記 |
2,600千円 (直接経費: 2,000千円、間接経費: 600千円)
2021年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2020年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2019年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
|
キーワード | コンコーダンサ / 述語項構造 / ブロックベース / 意味役割 / 概念フレーム / パターンマッチ / PropBank形式 / 深層学習 / BERT / prolog / 言語資源 / 言語パターン / Blockly / PropBank |
研究開始時の研究の概要 |
名詞や述語(動詞・サ変名詞・形容詞)の項構造(例えば「著者」ならば「Xの著者はYだ」(Xは作品で,Yは作者))をプログラムで利用可能な形でデータを構築すると共に,コーパスコンコーダンサとして利用者が簡単に辞書を組み合わせてパターンマッチで利用できる解析環境を構築する.辞書の記述とパターンマッチは項構造だけでなく構文(XがVしてくれる/Pなわけだ)まで視野に入れた記述枠組を構築する.これにより,語彙意味論で分析されている構文や項構造をプログラムの辞書として蓄積することができる.さらにパターンマッチとして利用できることで,語彙意味論の成果を処理で活用することが容易になる.
|
研究成果の概要 |
述語項構造辞書の拡張として新たにPropBank形式の意味役割体系を導入して日本語に適用した体系を整備した.具体的にはArg0,Arg1やArgMのように必須項と付加詞を分けて記述して使役態や受動態,被害受身など異なる構文にも項が追跡できるように拡張した.また辞書項目を拡張・整備しWebサイトを通じて公開した.述語項構造をテキストに付与するモデルとして深層学習モデルやベイズの定理に基づくモデルを適用し精度が向上する手法を明らかにした.意味役割付与システムを利用して,テキストに対してブロックベースでパターンを組み合わせて意味役割と概念フレームを利用してテキストを検索するコンコーダンサを開発した.
|
研究成果の学術的意義や社会的意義 |
本研究成果の中心的な意義は,従来,言語学における語彙意味論の中で議論されてきた意味役割と概念フレームといった述語項構造を実際に工学的に作成し応用システムまで開発したことである.PropBank形式を体系に導入することで,日本語特有の構文である被害受身などを同じ枠組でどのように記述するかを明らかにして国際会議で発表した.また,日本語の述語項構造を利用したアプリケーションとしてコンコーダンサを実装したことは,語彙意味論の成果を使える形で利用できる新たな枠組を提案したことになる.言語学習者などが言語表現を探す際に利用できるシステムになっており,言語理論を社会で利用する一例を具体的に示した.
|