研究課題/領域番号 |
25280084
|
研究機関 | 愛媛大学 |
研究代表者 |
二宮 崇 愛媛大学, 理工学研究科, 准教授 (20444094)
|
研究期間 (年度) |
2013-04-01 – 2018-03-31
|
キーワード | 自然言語処理 / 構文解析 / HPSG / 言語学 / 人工知能 |
研究実績の概要 |
平成26年度は、研究計画に沿って、日本語HPSGの文法規則の作成およびツリーバンク(正解構文木の集合)の作成を行った。まず、文法の核となる少数の文法規則を開発した。次に、構文木の統語情報を決定するルールを開発し、係り受け解析付テキストから日本語HPSGツリーバンクを半自動的に作成した。得られた日本語HPSGツリーバンクからHPSGの語彙項目を自動的に獲得することで、開発した文法規則とあわせて日本語HPSG文法を実現した。 日本語HPSG文法のコーパス指向文法開発における中心的な課題は、文法規則の開発と、ツリーバンクの開発である。文法規則については、複雑な言語現象の扱いは来年度以降の計画とし、格フレームの扱いや修飾句の扱いなど基本的な言語現象を扱う文法規則を作成した。日本語HPSGツリーバンクの作成には京都大学テキストコーパス4.0とNAISTテキストコーパス1.5を用いた。まず、京都大学テキストコーパスの係り受け解析の結果を句構造解析の結果に変換することで、単純な句構造木の集合を得た。続いて、構文木の統語情報を決定する規則を開発し、それらを適用することで、主辞やカテゴリ情報などの句構造に関する部分的な情報を与えたツリーバンクを作成した。得られた部分的なツリーバンクに対し、先に開発した文法規則を適用することで、完全な形の日本語HPSG構文木が得られた。日本語HPSGツリーバンクの各構文木の葉ノードを集めることで、日本語HPSG文法の辞書項目が得られる。 平成26年度は、これらの研究を円滑に行うための計算機サーバーと、データを保存するためのハードディスクを購入し、開発のための環境を整えることを行った。 関連する応用研究として、述語項構造に対する概念ベクトルの学習、深層学習を用いた評判分析、文法誤り検出、パラメータ平均化の研究も行った。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
研究目的の年度計画に従って予定通り研究が進んだ。平成26年度は日本語HPSG文法のツリーバンクおよび文法作成を行う予定であったが、その目的をおおよそ達成することができた。
|
今後の研究の推進方策 |
平成27年度は平成26年度に開発した日本語HPSG文法の精錬化を行い、日本語HPSG文法のための統計モデルの学習を行う。統計モデルの学習には条件付き確率場によるHPSGのための確率モデルを用いる。条件付き確率場の素性関数については、英語HPSG文法のための素性関数や、日本語係り受け解析で用いられている素性関数を参考にして設計を行う。統計学習には高性能な計算サーバーや端末が必要となるためそれらを購入し、開発を行う。また、開発する文法や統計モデルについて意見を求めるため研究打ち合わせを行う。
|
次年度使用額が生じた理由 |
平成26年度に研究を行った結果、想定よりも性能の高い計算サーバーが次年度以降必要になることが判明した。そのため、新たに計算機の選定を行う必要があるが、この選定作業と納品に時間を要すると判断したため、平成27年度に購入することにした。
|
次年度使用額の使用計画 |
研究開発で必要とされる計算サーバーの購入に用いる。
|