2009 Fiscal Year Annual Research Report
超大規模半構造化知識ベースとの融合による高度な言語処理技術の実用化
Project/Area Number |
21500131
|
Research Institution | The University of Tokyo |
Principal Investigator |
松崎 拓也 The University of Tokyo, 大学院・情報理工学系研究科, 助教 (40463872)
|
Co-Investigator(Kenkyū-buntansha) |
増田 勝也 東京大学, 大学院・工学系研究科, 特任研究員 (20512114)
|
Keywords | 自然言語処理 / データベース |
Research Abstract |
1.知識ベースとの融合により精度を向上させるべき自然言語処理タスクとして構文解析に焦点を当て,現在の解析モデルで頻出するエラーのタイプについての調査,および,よりよいモデリングについての研究を行った.具体的には,構文解析器のモジュールのひとつであるスーパータガーにおける処理に着目し,構文解析における誤りの大部分は,スーパータギング処理段階での誤りとして検出できることを確認した.また,文法による制約とスーパータギング処理との関係を探り,より精度の高いスーパータギング処理を行うためには,文法制約を満たす出力のうち,さらにエラーと考えられるものを検出すべきであることを示した.以上の成果は,国際学会11th International Conference on Parsing Technologyにて発表した. 2.知識ベース検索の核となる検索エンジン部分について,テクストに付加されるデータを自由にアップデートするためのデータベースのモジュール化,および検索の高速化を実現するための研究を行った.新たに設計および実装を行った検索システムでは,従来の設計によるものと同程度の検索時間を実現しながら,付加データの種別ごとのデータベース更新が可能になった.これは,今後テクストベースを言語処理モジュールと結合した際,処理モジュールごとに必要なデータを随時追加・更新するために必須の機能である.また,頻出するクエリに対して検索結果をキャッシュし,高速な応答を実現するための機能について設計を行った.
|
Research Products
(1 results)