2016 Fiscal Year Annual Research Report
実用的な日本語格解析のための確率的日本語主辞駆動句構造文法に関する研究
Project/Area Number |
25280084
|
Research Institution | Ehime University |
Principal Investigator |
二宮 崇 愛媛大学, 理工学研究科, 教授 (20444094)
|
Project Period (FY) |
2013-04-01 – 2018-03-31
|
Keywords | 自然言語処理 / 構文解析 / HPSG / 言語学 / 人工知能 |
Outline of Annual Research Achievements |
平成28年度は、日本語HPSGツリーバンクの詳細化による文法精緻化の研究と開発を行い、また、格解析のために必要となる意味表現獲得の研究および実験を行った。 文法精緻化については、ツリーバンクの格情報を用いた日本語句構造の詳細化を行った。本研究で用いるコーパス指向文法開発手法において、より良い文法を得るためには精密な日本語句構造ツリーバンクを作成することが最も重要な課題となっている。本研究では、日本語係り受け解析コーパスである京都大学テキストコーパスを用い、文節に基づく係り受け構造を日本語HPSG文法のための句構造に変換することで、日本語HPSGツリーバンクを得ている。平成28年度は、格解析と固有名解析が与えられたNAISTテキストコーパスを用い、その中に記述されている格情報を用いることで、格フレームと修飾句の区別が厳密に与えられた日本語HPSGツリーバンクおよび日本語HPSG文法を実現した。また、深層学習による構文解析を実現するために、NLTKと呼ばれるPythonプログラミング言語上で稼働する自然言語処理ツールを用いて、日本語HPSGツリーバンクおよび日本語HPSG文法を開発する作業を行った。 本研究ではより高い精度の格解析を実現するために、深層学習を用いることを検討している。平成28年度は、深層学習により現実世界の情報と記号の意味を結びつける記号接地の研究を行い、固有名解析において従来の機械学習手法よりも高い精度を実現した。また、ニューラル機械翻訳において敵対性生成モデル(GAN)が有効であることを実験により示した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
研究目的の年度計画に従って日本語HPSG文法の開発と格解析の研究を進めている。日本語HPSG文法の開発については、句構造変換、固有名情報、格情報を用いることで精緻な日本語HPSG文法の半自動獲得を実現し、得られた日本語HPSGツリーバンクから帰納学習を行うことで日本語HPSG文法を獲得した。一方で、得られたツリーバンクと文法の検証はまだ行われていないため、その検証作業と、検証作業の結果によるツリーバンクと文法の修正作業が課題として残っている。 格解析については、単語や句の意味と関わる難しい課題となっており、確率モデルだけでは不十分であることがわかってきている。現在、格解析に深層学習と決定性解析を用いることを検討しており、現在までに、深層学習による述語項構造の意味表現獲得、深層学習と記号接地による固有名解析、敵対性生成モデルを用いたニューラル機械翻訳の評価実験を行った。
|
Strategy for Future Research Activity |
最終年度となる平成29年度は、これまでに開発した日本語HPSGツリーバンクおよび日本語HPSG文法の精緻化と修正を行い、深層学習と決定性構文解析を導入することで実用的な日本語格解析システムを実現する。日本語HPSGツリーバンクと日本語HPSG文法については、自然言語処理ツールのNLTKを用いて開発済みであるため、NLTKと深層学習ツールのChainerを用いることで、深層学習による決定性構文解析を実現する。
|
Causes of Carryover |
平成28年度の研究成果に関して研究打ち合わせを行う予定であったが、先方の都合のため、平成29年度に行うことにした。
|
Expenditure Plan for Carryover Budget |
研究課題に関する研究打ち合わせのために旅費として用いる。
|
Research Products
(2 results)