2016 Fiscal Year Annual Research Report
分散表現と構成的意味計算に基づくテキストと知識ベースの頑健なグランディング
Project/Area Number |
15H05318
|
Research Institution | Tohoku University |
Principal Investigator |
岡崎 直観 東北大学, 情報科学研究科, 准教授 (50601118)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | 自然言語処理 / 知識獲得 / 意味解析 / 表現学習 / 分散表現 / 深層学習 |
Outline of Annual Research Achievements |
本研究では,与えられたテキストを知識ベースのインスタンスにグランディングする解析器を開発し,その実タスクでの応用を検証する.平成28年度は,研究項目①「関係パタンの構成的な意味計算」,②「関係パタンの曖昧性解消」,③「グランディングのためのコーパス構築」に取り組んだ. 研究項目①では,「increase the risk of」のような関係パタンの意味を,「increase」「the」「risk」「of」といった構成単語の意味ベクトルから合成する関数を深層ニューラル・ネットワークで学習する新手法を考案した.研究項目②では,研究項目①の合成関数から計算される関係パタンの意味ベクトルを,SemEval 2010 Task 8の関係曖昧性解消タスクに適用し,世界最高性能と同等の性能が得られることを実証した.これらの研究成果は,自然言語処理分野最難関の国際会議ACLに採択されるなど,国内外で高い評価を得ている. 研究項目③では,Wikipediaおよびその派生物を既存の知識ベースと見なし,研究を進めている.平成27年度に開発したコーパスの研究成果をまとめたものをACLのワークショップで発表した.さらに,本コーパスを活用し,日本語の実体・概念をWikipedia記事に対応付ける解析器を開発し,国際ジャーナル論文として発表した. また,Wikipediaの記事中で言及されている因果関係の事例をラベル付けしたコーパスの試作を進めた.このコーパスは,1,494件のWikipedia記事から取得した8,745文から構成され,95,008件の因果関係事例がクラウドソーシング・サービスで付与されている.本コーパスは,因果関係の自動解析器を構築するための訓練データとして活用できるだけでなく,クラウドソーシングにおける品質管理に関する指針など,稀有かつ有用な言語資源としての活用・発展が期待される.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
交付申請書では,研究項目①「関係パタンの構成的な意味計算」,②「関係パタンの曖昧性解消」,③「グランディングのためのコーパス構築」を計画していた.このうち,研究項目①と②の研究成果は,自然言語処理分野最難関の国際会議ACLや国際ジャーナルに採択された.また,研究項目②に関連して,画像中の物体間の関係をテキストと対応付けて認識する研究を進め,自然言語処理分野の国際会議PACLIC-30でBest Paper Honorable Mentionsを受賞した. 研究項目③では,実体・概念をWikipediaにグラウンディングするコーパスを平成27年度までに構築・公開した.平成28年度は,本コーパスを国際会議論文として発表した.さらに,本コーパスを訓練事例として活用し,実体・概念をWikipediaにグラウンディングするための解析器を開発し,国際ジャーナルとして発表した.さらに,本研究プロジェクトの研究項目④「実タスクにおける検証」は来年度実施予定であるが,意見分析の実タスクを想定し,因果関係知識に関するコーパスを構築した. さらに,本年度は7件の招待講演での発表と,2件の受賞(平成28年度科学技術分野の文部科学大臣表彰若手科学者賞,第15回船井学術賞)があった.
|
Strategy for Future Research Activity |
研究項目①②③では,すでに研究成果の対外発表を行い,さらにソフトウェアや言語資源として公開を終えている.したがって,すでに研究成果を研究コミュニティや社会に還元する段階に到達している.今後も,講演などの機会を通して,研究成果の広報活動を継続していく. 平成29年度は,基盤研究(研究項目①②③)の成果に基づき,研究項目④「実タスクにおける検証」を進める予定である.また,実タスクでの検証によって浮き彫りになった課題を基盤研究にフィードバックすることで,研究の基盤技術と出口を繋げたい.
|
Research Products
(22 results)