2020 Fiscal Year Annual Research Report
Development of a multi-purpose categorial grammar treebank
Project/Area Number |
18K00523
|
Research Institution | National Institute for Japanese Language and Linguistics |
Principal Investigator |
窪田 悠介 大学共同利用機関法人人間文化研究機構国立国語研究所, 理論・対照研究領域, 准教授 (60745149)
|
Co-Investigator(Kenkyū-buntansha) |
峯島 宏次 慶應義塾大学, 文学部, 准教授 (80725739)
|
Project Period (FY) |
2018-04-01 – 2021-03-31
|
Keywords | カテゴリ文法 / ツリーバンク / 意味解析 / 日本語 / NPCMJ / ABCツリーバンク |
Outline of Annual Research Achievements |
理論言語学と自然言語処理の両分野での研究資源として活用できる汎用的な範疇文法のツリーバンクであるABCツリーバンクを構築し、オープン・アクセスで公開した。範疇文法は、自然言語処理分野では明示的な意味解析の枠組みとして広く用いられている。ABCツリーバンクは、日本語の範疇文法ツリーバンクで公開されているものとして現在唯一のものであり、理論言語学、自然言語処理両分野を取り結ぶ学際的な研究領域の活性化に寄与することが期待される。言語学的には、特に、使役や受身などの文末述語の扱いや名詞修飾の構造に関して、構成的意味論を導くために妥当な分析に基づくアノテーションを行っている点に特色がある。パーザやツリーバンクなど、自然言語処理のツールを援用した計算論的モデリングに基づく言語研究が近年理論言語学研究において活発になってきているため、意味解析にまで踏み込んだモデリング研究のための基盤資源としての利用が特に期待できる。
ABCツリーバンクは、句構造ツリーバンクである、けやきツリーバンクを自動変換することで構築した。構築の際に用いたスクリプト、depccgパーザをツリーバンクで訓練したモデルなどの関連ツールもオープン・アクセスで公開している。また、最終年度には、depccgパーザとccg2lambdaのツールキットを使って意味表示を導出するパイロット実験を行い、自然言語処理分野での意味解析の枠組みとしての利用が可能であることを確認した。
|