研究実績の概要 |
本研究では,与えられたテキストを知識ベースのインスタンスにグランディングする解析器を開発し,その実タスクでの応用を検証する.平成28年度は,研究項目①「関係パタンの構成的な意味計算」,②「関係パタンの曖昧性解消」,③「グランディングのためのコーパス構築」に取り組んだ. 研究項目①では,「increase the risk of」のような関係パタンの意味を,「increase」「the」「risk」「of」といった構成単語の意味ベクトルから合成する関数を深層ニューラル・ネットワークで学習する新手法を考案した.研究項目②では,研究項目①の合成関数から計算される関係パタンの意味ベクトルを,SemEval 2010 Task 8の関係曖昧性解消タスクに適用し,世界最高性能と同等の性能が得られることを実証した.これらの研究成果は,自然言語処理分野最難関の国際会議ACLに採択されるなど,国内外で高い評価を得ている. 研究項目③では,Wikipediaおよびその派生物を既存の知識ベースと見なし,研究を進めている.平成27年度に開発したコーパスの研究成果をまとめたものをACLのワークショップで発表した.さらに,本コーパスを活用し,日本語の実体・概念をWikipedia記事に対応付ける解析器を開発し,国際ジャーナル論文として発表した. また,Wikipediaの記事中で言及されている因果関係の事例をラベル付けしたコーパスの試作を進めた.このコーパスは,1,494件のWikipedia記事から取得した8,745文から構成され,95,008件の因果関係事例がクラウドソーシング・サービスで付与されている.本コーパスは,因果関係の自動解析器を構築するための訓練データとして活用できるだけでなく,クラウドソーシングにおける品質管理に関する指針など,稀有かつ有用な言語資源としての活用・発展が期待される.
|