2018 Fiscal Year Research-status Report
Development of a multi-purpose categorial grammar treebank
Project/Area Number |
18K00523
|
Research Institution | University of Tsukuba |
Principal Investigator |
窪田 悠介 筑波大学, 人文社会系, 助教 (60745149)
|
Co-Investigator(Kenkyū-buntansha) |
峯島 宏次 お茶の水女子大学, シミュレーション科学・生命情報学教育研究センター, 特任准教授 (80725739)
|
Project Period (FY) |
2018-04-01 – 2021-03-31
|
Keywords | 範疇文法 / ツリーバンク / アノテーション |
Outline of Annual Research Achievements |
本研究では、理論言語学と自然言語処理の両分野での研究資源として活用できる、汎用的な範疇文法のツリーバンクを構築する。範疇文法は、深い解析を用いた意味解析を行うための基盤として、意味処理に関する研究が本格化しつつある自然言語処理研究において現在注目を集めている言語理論である。また、理論言語学研究においても、ツリーバンクやパーザーなどを心理言語学的モデリングのためのリソースとして用いる、経験科学としての新たな手法に注目が集まっており、数学的に厳密な基盤を持つ言語理論である範疇文法の、言語理論としての側面に特に注目が高まっている。このため、言語学的な知見を正確に反映したツリーバンクを構築することにより、自然言語処理研究と理論言語学研究を結びつけた新たな学際的研究領域における研究を飛躍的に促進することができると考えられる。
本研究では、理論言語学と計算言語学の研究者の共同研究として範疇文法ツリーバンクの構築に取り組み、理論言語学、自然言語処理両分野を取り結ぶ学際的な研究領域の活性化に寄与することを目指す。本年度は、本研究を開始する前に始めていた予備的研究の結果に基づき、以下の項目に関する作業を集中的に進めた。(1) 変換元である句構造文法ツリーバンクから自動で範疇文法ツリーバンクを生成する工程の精緻化。(2) 項構造の変更を伴う、いわゆる複雑述語の扱いを言語学的に妥当なものとするための後処理の工程の設計と実装。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
年度後半から当初の予定通りアノテータ二名を雇用し、研究代表者、研究分担者、アノテータ間で緊密に連絡を取り合いながら作業を進めた。本年度予定していた複雑述語の分析を精緻化する作業が年度末までにほぼ終了したため、おおむね順調に進んでいると判断できる。研究成果は3月の言語処理学会で発表した。
|
Strategy for Future Research Activity |
来年度は、本年度の成果に基づき、引き続き、自動変換したツリーバンクの修正を進める。具体的には、名詞句の量化の分析を言語学的に妥当なものにする作業に取り組むことを予定している。また、述語の分析と名詞句の分析が一段落したら、来年度後半からは、パーザーの学習データとしてツリーバンクを用いるなどの手法によって、ツリーバンクの妥当性を客観的に検証する作業にも取り組む予定である。
|
Causes of Carryover |
専門知識を持つアノテータが作業を開始できる時期が年度後半以降であったため、年度前半に支出予定だったアノテータへの業務委託作業への報酬が発生しなかった。また、本研究のコーパスの構築に必要なコーパス資源を研究代表者がすでに所持していたため、コーパス購入資金として見積もっていた額が未使用となった。このため次年度使用額が生じた。次年度使用額は、コーパス構築のうち、人手と労力が必要となる、アノテータへの業務委託作業への報酬に回す予定である。
|
Research Products
(4 results)