研究課題/領域番号 |
19K12108
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61030:知能情報学関連
|
研究機関 | 大阪学院大学 |
研究代表者 |
大谷 朗 大阪学院大学, 情報学部, 教授 (50283817)
|
研究期間 (年度) |
2019-04-01 – 2022-03-31
|
研究課題ステータス |
完了 (2021年度)
|
配分額 *注記 |
4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2021年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2020年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2019年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
|
キーワード | コーパス / ツリーバンク / HPSG / 主辞駆動句構造文法 / 日本語 / 言語処理 / 言語資源 / Keyaki / 言語的制約 / 言語情報 / 日本語文法 / 日本語HPSG / 文法形式化 / 文法解析 |
研究開始時の研究の概要 |
本研究では,言語学的な一般化を機械可読な文法として実用化する際に生じるさまざまな問題を解決しつつ,精細な分析に基づくタグが付与されたツリーバンクの統語・意味解析情報の統括的な形式化として,大規模な日本語HPSG文法を構築する.ツリーバンク開発の手法とツールを援用し,記述した文法を対象コーパス全体の高速解析に適用することで,さらなる文法の修正を得るといった作業を繰り返し,量と質を兼ね備えた言語資源を効率的に開発することを目指す.
|
研究成果の概要 |
本研究では語彙レベルの品詞タグと句レベルの機能情報に関する注釈が付与されたKeyakiコーパスを基にHPSGツリーバンクを構築する方法について考察した。Keyakiの注釈付与スキームは特定の言語理論に拠らないが、我々のツリーバンクは主辞駆動句構造文法(HPSG)に基づくことで統語情報だけでなく他の言語情報を付与することができる。こうしたツリーバンクはHPSGパーサーが解析し、言語学者が確認,修正した句構造木から半自動的に作成することができる。
|
研究成果の学術的意義や社会的意義 |
言語学的な分析に基づいて形式化された文法とコンピュータによって実世界のテキストを大量に解析するために設計されたデータ構造とを結び付けようとする本研究は、精細な統語構造と簡単な意味情報の注釈を各文に付与した日本語ツリーバンクを半自動的に構築した。そして、それがより精細なものとなるように改良を重ねていくことで、言語研究の発展だけでなく情報化社会を支える日本語処理の精度向上にとっても有用な言語資源の開発を目指した。
|