2010 Fiscal Year Annual Research Report
超大規模半構造化知識ベースとの融合による高度な言語処理技術の実用化
Project/Area Number |
21500131
|
Research Institution | The University of Tokyo |
Principal Investigator |
松崎 拓也 東京大学, 大学院・情報理工学研究科, 助教 (40463872)
|
Co-Investigator(Kenkyū-buntansha) |
増田 勝也 東京大学, 大学院・工学系研究科, 特任研究員 (20512114)
|
Keywords | 自然言語処理 / データベース |
Research Abstract |
1,前年に引き続き,知識ベースとの融合により精度を向上させるべき自然言語処理タスクとして構文解析技術に焦点を当て,知識ベースから抽出するデータを組み込む基礎となる解析モデルについての研究を行った。具体的には,スーパータギングと呼ばれるモジュールに付加的な情報を導入することによって解析精度を向上させる技術を開発し,さらに,モデル訓練時に,文法制約を満たすような解空間へとスーパータギング処理の出力を制約することによって構文解析処理全体の精度を向上させる技術を開発した,以上2つの成果を,国際学会North American Chapter of the Association for Computational Linguistics(NAACL-HLT10)およびInternational Conference on Computational Linguistics(COLING-10)において発表した. 2.知識ベース検索の核となる,構造検索エンジンの高速化についての研究を行った.具体的には,与えられた構造クエリに対し,その検索結果を包含するような計算済みの部分クエリ集合を求め,計算済みの結果を効率的に利用することによって検索処理を最大で10倍程度高速化することに成功した.
|
Research Products
(2 results)