2011 Fiscal Year Annual Research Report
超大規模半構造化知識ベースとの融合による高度な言語処理技術の実用化
Project/Area Number |
21500131
|
Research Institution | National Institute of Informatics |
Principal Investigator |
松崎 拓也 国立情報学研究所, 社会共有知研究センター, 特任准教授 (40463872)
|
Co-Investigator(Kenkyū-buntansha) |
増田 勝也 東京大学, 工学(系)研究科(研究院), 特任研究員 (20512114)
|
Keywords | テキストベース / 構文解析 / 共参照・照応解析 |
Research Abstract |
1. テキストベースから抽出した統計量を用い高精度な構文解析を行う枠組みについて研究を行い、その成果を国際会議 European Chapter of the Association for computational Linguistics (EACL-2012) において発表した。この研究では、統語的曖昧性が特に問題となる並列句の解析において、従来の教師付き学習による解析手法と、表層的な類似性を基に解析を行う手法を統合する技術を開発した。これにより、テキストベースより抽出した単語間の類似性に関する統計量を用いた曖昧性解消を、従来の教師付き学習に基づく解析と効果的に統合することが可能となった。また、前年度までの supertagging 技術を軸とした構文解析の高精度化に関する研究結果を総合し論文誌 Natural Language Engineering において発表した。 2. 共参照・照応解析における曖昧性解消に種々の知識を用いる手法について研究し、その成果を論文誌 BMC Bioinformatics において発表した。この研究は、統語的な特徴・意味的な特徴など様々な要素が参照・照応表現の先行詞同定に関与する様子を観察し、それら種々の要素を考慮した解析モデルを用いた実験結果について詳細な分析を行ったものである。分析の結果から、共参照・照応解析における詳細な分野知識の重要性が明らかになった。これは、テキストベースから動的に抽出すべき知識タイプを定める上で大きな前進である。
|
Current Status of Research Progress |
Reason
24年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
24年度が最終年度であるため、記入しない。
|
Research Products
(5 results)